Vous êtes sur le blog de David Madore, qui, comme le
reste de ce site web, parle de tout et
de n'importe quoi (surtout de n'importe quoi, en fait),
des maths à
la moto et ma vie quotidienne, en passant
par les langues,
la politique,
la philo de comptoir, la géographie, et
beaucoup de râleries sur le fait que les ordinateurs ne marchent pas,
ainsi que d'occasionnels rappels du fait que
je préfère les garçons, et des
petites fictions volontairement fragmentaires que je publie sous le
nom collectif de fragments littéraires
gratuits. • Ce blog eut été bilingue à ses débuts (certaines
entrées étaient en anglais, d'autres en français, et quelques unes
traduites dans les deux langues) ; il est
maintenant presque exclusivement en
français, mais je ne m'interdis pas d'écrire en anglais à
l'occasion. • Pour naviguer, sachez que les entrées sont listées par
ordre chronologique inverse (i.e., celle écrite en dernier est en
haut). Certaines de mes entrées sont rangées dans une ou plusieurs
« catégories » (indiqués à la fin de l'entrée elle-même), mais ce
système de rangement n'est pas très cohérent. Cette page-ci rassemble
les entrées de la catégorie Langues & Linguistique :
il y a une liste de toutes les catégories à la fin de cette page, et
un index de toutes les entrées.
Le permalien de chaque entrée est dans la date, et il est aussi
rappelé avant et après le texte de l'entrée elle-même.
You are on David Madore's blog which, like the rest of this web
site, is about everything and
anything (mostly anything, really),
from math
to motorcycling and my daily life, but
also languages, politics,
amateur(ish) philosophy, geography, lots of
ranting about the fact that computers don't work, occasional reminders
of the fact that I prefer men, and
some voluntarily fragmentary fictions that I publish under the
collective name of gratuitous literary
fragments. • This blog used to be bilingual at its beginning
(some entries were in English, others in French, and a few translated
in both languages); it is now almost
exclusively in French, but I'm not ruling out writing English blog
entries in the future. • To navigate, note that the entries are listed
in reverse chronological order (i.e., the latest written is on top).
Some entries are classified into one or more “categories” (indicated
at the end of the entry itself), but this organization isn't very
coherent. This page lists entries in
category Languages & Linguistics: there is a list of
all categories at the end of this page, and
an index of all entries. The
permalink of each entry is in its date, and it is also reproduced
before and after the text of the entry itself.
Pourquoi trois personnes dans les conjugaisons et pas plus ?
Je précise d'emblée que ce billet n'est pas à prendre très au
sérieux. C'est juste une idée qui me revient en repensant à ce que
j'ai écrit récemment sur les
conjugaisons.
En français et dans un certain nombre d'autres langues qui
conjuguent les verbes, l'un des traits grammaticaux qui déterminent
l'inflexion du verbe est la personne du sujet, et elle
distingue trois possibilités, à savoir si la personne qui accomplit
est :
la personne (ou plus rarement, chose) qui s'exprime, ou
un groupe qui la contient,
la personne (ou plus rarement, chose) à qui on s'adresse,
ou un groupe qui la contient, ou enfin
n'importe quelle autre personne ou chose ou groupe de telles.
Ces cas de figures s'appellent respectivement la première
personne, la deuxième personne et la troisième
personne (la numérotation, bien sûr, est
une pure convention et il y a des
langues où on fait plutôt l'ordre inverse, mais ça ce n'est pas une
caractéristique intrinsèque de la langue, juste un choix des
grammairiens qui l'étudient ; par contre le fait qu'il y ait ces trois
cas est assez nettement une caractéristique de la langue).
La grande majorité des langues indo-européennes qui font varier le
verbe selon le sujet utilisent cette typologie en trois personnes
(j'écris la grande majorité parce que je ne veux pas me
mouiller trop et si j'écrivais toutes il y aurait certainement
quelqu'un qui viendrait m'expliquer que dans le dialecte bordurien du
vieux syldave il n'y a que deux personnes au singulier et quatre au
pluriel, mais disons que je ne connais pas de
contre-exemple[#], même s'il y a
des exemples de langues indo-européennes qui ne font pas du
tout varier le verbe selon la personne, ou seulement selon le
genre et nombre du sujet comme le passé en russe qui est visiblement
une sorte de participe accordé avec le sujet).
[#] Bon, on peut ergoter
que les formes de politesse cassent un peu ce modèle. Par exemple, le
pronom Sie de l'allemand se présente
inflexionnellement comme un pronom de la troisième personne du pluriel
mais fonctionne sémantiquement comme un pronom de la deuxième personne
(singulier ou pluriel) en forme de politesse. De même, la
multiplicité des pronoms de la deuxième personne en néerlandais
(du, gij, jij
et u) ne se laisse pas si facilement analyser.
Il me semble que ce ne sont pas des objections très sérieuses même si
ça doit nous rappeler que les choses en linguistiques
sont toujours un peu floues.
Par ailleurs, ces langues indo-européennes font aussi varier le
verbe selon le nombre du sujet en même temps que la personne ; et à ce
propos, pour autant que je sache, la « clusivité » au pluriel est très
majoritairement définie par les règles suivantes : dès que la personne
qui s'exprime fait partie du groupe, c'est la première personne du
pluriel (indépendamment du fait que telle ou telle autre personne
soit dedans : i.e., nous peut vouloir dire moi et toi
(= « nous inclusif ») comme moi et lui (= « nous exclusif »)) ;
sinon, dès que la personne à qui on s'adresse fait partie du groupe,
c'est la deuxième personne du pluriel ; sinon c'est la
troisième personne du pluriel.
J'ai l'impression que ces règles sont extrêmement spécifiques.
Ce que je trouve assez fascinant, c'est qu'il y a des
langues non indo-européennes qui semblent les suivre aussi au
moins partiellement : disons que sur une description superficielle de
leur grammaire (je n'ai pas une connaissance assez correcte de ces
langues pour vraiment juger), les conjugaisons de l'arabe, du turc, du
hongrois et du finnois, qui représentent au moins deux-trois familles
de langues indépendantes et indépendantes des langues
indo-européennes, ont l'air de se conformer à peu près à cette
distinction tripartite sur la personne (à laquelle on peut ajouter la
distinction singulier/pluriel sur le nombre). C'est moins clair de ce
que je lis des grammaires du swahili et du basque, pour prendre des
exemples au pif de langues encore indépendantes de tout ça, mais j'y
vois quand même des références à la première et la deuxième
personne.
Évidemment, il y a aussi des langues où ça ne veut pas dire
grand-chose : par exemple si les verbes sont complètement invariables
et qu'on a plein de pronoms pour plein de situations différentes, on
peut toujours décider d'en appeler certains pronoms de la première,
deuxième et troisième personne, mais ce sera juste plaquer une
typologie artificielle sur une langue qui s'en fout. (Bien sûr aussi,
toute langue a forcément une façon de dire je mange, tu
manges et il mange, mais cette distinction n'a aucune
raison d'être obligatoire, et inversement elle peut être plus précise,
peut-être que je mange se dit différemment selon qu'on est un
homme jeune, une femme âgée, une personne qui a les cheveux longs,
l'Empereur, ou je ne sais quoi encore.)
Pour y voir plus clair, il faudrait une grande base de données
ouvertes des langues avec une description unifiée de leurs
caractéristiques, sur laquelle on puisse rechercher ce genre de
choses. Il y a un livre, depuis devenu un site Web,
le World Atlas of
Language Structures, qui est censé répondre précisément à
ce type d'interrogation (et devrait éviter de consulter des grammaires
de qualité douteuse du turc et du basque pour essayer de deviner s'il
y a un concept de première / deuxième / troisième personne dans ces
langues), mais à chaque fois que j'ai essayé de trouver quelque chose
dedans, j'ai été épaté par la pauvreté des caractéristiques
répertoriées, et ce cas ne fait pas exception : je ne
trouve rien dans leur
inventaire qui essaie de répertorier si une langue a des
notions[#2] de première,
deuxième et troisième personne.
[#2] Bien sûr
on peut objecter que cette question n'a pas de sens, parce que ce
n'est pas clair ce que ça veut dire qu'une langue ait la
notion : mais c'est le cas de quasiment toutes les
caractéristiques évoquées dans
le WALS (je ne vais quand même
pas refaire encore un lien vers mon billet sur les frontières floues,
si ?). En tout cas je ne trouve rien qui ressemble même à mon
interrogation.
Le fait qu'on retrouve quand même une typologie étonnamment
semblable (à mes yeux) dans des familles langues qui sont censées être
indépendantes m'amène à me demander quelle en est l'explication : je
peux imaginer plusieurs hypothèses, ni exclusives ni exhaustives (et
certainement pas forcément la même d'un cas à l'autre) :
c'est un hasard ;
c'est « naturel », ça fait partie du fonctionnement du cerveau
humain de penser en trois personnes (moi, toi et lui) ;
c'est le signe d'une parenté entre les langues en question (pas
forcément un signe de l'existence
d'une langue
ancestrale universelle, mais au moins la trace d'une
super-famille) ;
c'est le résultat d'une évolution grammaticale convergente par
échanges horizontaux entre familles distinctes
(Sprachbund) ;
c'est le résultat d'une fausse perspective apportée par la manière
dont les grammairiens (majoritairement natifs de langues
indo-européennes) analysent les langues en question, en plaquant des
concepts venus, disons, de la grammaire latin, sur des langues pour
lesquelles ces concepts sont inadaptés.
Je ne sais pas bien quoi croire entre tout ça (et, je répète, rien
ne dit que la ou les explications concernant l'arabe soient les mêmes
que concernant le turc).
✧
Néanmoins, je voudrais expliquer un peu, en réponse à l'hypothèse
que ce serait « naturel » de distinguer la personne qui s'exprime et
la personne à qui elle s'adresse de toutes les autres personnes, quel
serait l'intérêt possible d'avoir une langue distinguant quatre
personnes (au moins une des langues construites que j'avais
imaginées quand j'étais ado fonctionnait comme ça).
Quelles seraient ces quatre personnes ? Je pense principalement à
la distinction quadruple suivante :
Méditation la complexité des conjugaisons françaises et inflexions linguistiques en général
Avertissement
préliminaire : je vais faire référence dans ce billet à plein
de langues (français, latin, grec, mais aussi allemand, russe,
sanskrit, arabe). Ces langues ne servent qu'à illustrer mon propos
général sur la complexité des inflexions, et il va de soi que je ne
suppose pas qu'on les connaît (moi-même, je n'y connais pas
grand-chose), et je ne vais généralement même pas m'embêter à donner
le sens des mots que j'utilise comme exemples parce que ça n'a aucune
pertinence pour ce que je raconte. De même, il faut considérer les
noms des traits grammaticaux comme des mots dénués de sens : peu
importe ce qu'est que l'aoriste à part que c'est un temps de la
conjugaison des verbes grecs. (Prenez ça comme un mot à la fois
technique et poétique :
cf. d'ailleurs ce vieux fragment
littéraire que je ne peux pas ne pas référencer ici.) J'ai aussi
fait quantité de digressions marquées par des notes en petits
caractères : on peut les sauter, ou au contraire ne lire que ça, de
toute façon tout ceci est un rant un peu décousu, ce n'est pas comme
s'il y avait un plan ou des dépendances entre les parties.
Comme le terme linguistique de paradigme
inflexionnel n'est pas forcément clair pour tout le monde (je
ne suis même pas sûr que ce soit le bon), ce dont je parle est
l'ensemble des formes que peut prendre un même mot (ou plus exactement
un même lexème) à travers l'application de
différents traits grammaticaux. Comme cette
définition n'est elle-même pas forcément claire pour tout le monde, un
exemple familier pour tous les francophones est celui des tableaux
de conjugaison, par lesquels un même verbe (lexème verbal),
représenté par sa forme de dictionnaire qui,
s'agissant du français, est l'infinitif, prend des formes (inflexions)
diverses selon des traits grammaticaux
appelés mode, temps et personne (ou
nombre+personne). Les conjugaisons latines et grecques sont aussi des
paradigmes inflexionnels, avec à peu près les mêmes traits que pour le
français (la liste des modes et temps change, et le grec classique a
un nombre duel, mais l'idée est la même ; une autre différence est que
pour ces langues la forme du dictionnaire, c'est-à-dire la manière
dont on va ranger le verbe dans un dictionnaire, est la première
personne du singulier de l'indicatif présent au lieu d'être
l'infinitif, mais c'est un détail). Un autre exemple est celui des
tableaux de déclinaisons latines ou
grecques[#], qui pour un même
nom (lexème nominal, dont la forme de dictionnaire est le nominatif
singulier) donnent des formes variées en fonction de deux traits
appelés nombre et cas, ou, s'agissant des adjectifs,
trois traits appelés genre, nombre et cas.
[#] Ou bien sûr de plein
d'autres langues. Mais attention, une langue peut avoir
des cas sans pour autant avoir vraiment
de déclinaisons. En allemand, par exemple, les déclinaisons
portées par les noms sont quasiment vestigiales (à part la marque du
pluriel, pour la plupart des mots il ne subsiste qu'un -n au datif
pluriel et, s'agissant des féminins et neutres, un -s au génitif
singulier ; ou pour les noms dits faibles, la déclinaison est
essentiellement juste marquée par un -n partout). La marque des cas
en allemand est essentiellement sur les articles ou adjectifs (avec
des règles un peu tordues sur ces
derniers), et comme je ne crois pas qu'il existe d'adjectif
irrégulier, ce n'est pas vraiment le genre d'inflexion dont je parle
dans ce billet.
Conjugaison des verbes et déclinaison des noms et adjectifs sont
les paradigmes inflexionnels les plus familiers aux personnes qui
auront appris des langues comme le français, le latin, le grec
classique, le sanskrit ou l'arabe. Mais il peut évidemment y avoir
plein d'autres choses : on peut tout à fait imaginer une langue où les
adverbes varient (par exemple qu'ils s'« accordent » avec le verbe
comme les adjectifs s'accordent avec les noms dans les langues que je
viens de lister) ; en japonais, on peut dire que les adjectifs (enfin,
certaines sortes de mots qu'on pourrait qualifier d'adjectifs)
varient avec le temps ; et la division des mots en verbes, noms,
adjectifs, etc., est valable pour les langues indo-européennes et
sémitiques mais pas forcément transportable partout. Bref, j'utilise
le terme paradigme inflexionnel pour être plus large
que tableaux de conjugaison et de déclinaison, mais comme je
n'ai pas de bon exemple à proposer au-delà de la conjugaison et de la
déclinaison, imaginez les conjugaisons et les déclinaisons si vous
êtes familiers avec ça (ou d'ailleurs, juste les conjugaisons parce
que je vais surtout parler de ça).
Toutes les langues n'ont pas de mécanisme inflexionnel. Si le grec
classique, le russe et l'arabe en ont de fort complexes, le chinois
n'en a aucun[#2] (tous les mots
chinois sont invariables), et ceux de l'anglais sont considérablement
plus simples que ceux du français. Les langues scandinaves font
varier le verbe avec le temps/mode mais pas avec la personne, ce qui
fait déjà moins de traits que le français ou l'allemand.
[#2] Bon, quand on
parle de linguistique, il faut toujours ajouter des on peut
considérer que ou des en première approximation partout.
Je suis sûr que si je ne mettais pas cette note il y aurait un gros
malin pour me dire que well, actually, on peut
considérer que <…> est un mécanisme inflexionnel en
chinois : donc je mets cette note pour cette fois-ci, mais
n'hésitez pas à l'insérer dans la suite à chaque fois que quelqu'un
risque de dire well, actually.
Bien sûr, ce n'est pas toujours parfaitement clair ce qui constitue
exactement les inflexions d'un même lexème (pourquoi dirait-on que le
passage du singulier possible au pluriel possibles est
une inflexion alors que le passage de possible
à impossible est une dérivation lexicale ? c'est un chouïa
arbitraire[#3][#4]),
mais comme d'hab' je vais rappeler
que ce n'est pas parce que ce n'est pas
totalement clair que ça n'a pas de sens.
[#3] Un exemple
d'arbitraire est celui des aspects du verbe russe : un verbe russe
(comme dans l'essentiel des autres langues slaves, mais le russe est
le seul que je connais un petit peu) vient par paires avec une forme,
ou aspect, appelée perfectif et une autre
appelée imperfectif. Certains temps peuvent être utilisés sur
l'un ou l'autre aspect, avec une différence de sens (le perfectif
envisage l'action accomplie, ou son résultat, tandis que l'imperfectif
envisage l'action en train d'être accomplie, c'est-à-dire son
déroulement) ; certains temps sont formellement le même aux deux
aspects mais donnent des temps différents (la forme qui donne le
présent de l'aspect imperfectif devient un futur pour l'aspect
perfectif) ; certains temps n'existent que pour un des deux aspects.
Doit-on considérer que le perfectif et l'imperfectif sont deux formes
d'un même verbe, comme le singulier et le futur d'un nom ? Ou doit-on
au contraire considérer que ce sont deux verbes différents, qui se
complètent ? Je suppose que des grammairiens du russe ont passé des
pages et des pages à expliquer que l'un ou l'autre de ces points de
vue est meilleur que l'autre, et je ne suis pas compétent pour
trancher, comme pour le sexe des anges. Pour que je veux raconter
ici, il vaut sans doute mieux considérer pragmatiquement que le
perfectif et l'imperfectif sont deux verbes distincts, parce
qu'essayer de deviner le perfectif à partir de l'imperfectif ou vice
versa semble essentiellement impossible (d'ailleurs, pour les verbes
« simples » c'est plutôt le perfectif qui dérive de l'imperfectif
alors que pour les verbes à préfixe c'est plutôt le contraire). Mais
en tout cas, ça montre une difficulté à définir exactement ce qu'on
appelle un paradigme inflexionnel.
[#4] Un autre exemple
d'incertitude sur ce que c'est qu'un « lexème » et un « paradigme »
est celui des formes dérivées des verbes arabes. Un verbe arabe est
normalement une racine à trois consonnes, et cette racine, connue sous
le nom de forme I, peut directement donner un tableau de
conjugaison, qui est d'une taille relativement raisonnable (il y a
moins de temps et modes qu'en français ou en latin, pour ne rien dire
du grec, mais en contrepartie il y a plus de personnes parce que la
distinction masculin/féminin est faite en plus de celle de nombre à la
2e et 3e personnes). La complication, c'est que chaque racine peut
donner une douzaine ou une quinzaine de formes dérivées (formes
II à XV, parfois on en ajoute encore d'autres, même si en vrai les
formes I–X et peut-être XII sont les seules vaguement courantes) : le
sens de ces formes dérivés est variable et elles n'existent pas
toutes, mais leur fabrication à partir de la racine est assez
systématique, et ensuite chacune d'entre elles est un verbe qui a son
propre tableau de conjugaison. Faut-il considérer qu'un paradigme
flexionnel de verbe arabe est l'ensemble de toutes les conjugaisons de
toutes les formes dérivées (auquel cas ils sont très volumineux) ? Ou
seulement d'une seule d'entre elles (auquel cas ils sont plus
raisonnables, mais il y a une multiplication des types de
conjugaisons) ? C'est un peu le problème dual du russe évoqué à la
note précédente : le perfectif/imperfectif des verbes russes ont un
sens fixe mais une formation qui dépend de chaque verbe, alors que les
formes dérivées des verbes arabes ont une formation claire mais un
sens qui varie.
Quand je parle de complexité, ce qui compte n'est pas
tellement le nombre de traits grammaticaux qu'on peut ajouter. Une
langue qui aurait des déclinaisons avec 50 cas bien réguliers serait
toujours plus simple à apprendre qu'une langue qui a seulement 3 cas
mais avec des centaines de paradigmes différents pour les former, des
exceptions de partout, etc. C'est essentiellement de cette complexité
que je veux parler ici. (Je proposerai à la fin une piste pour
essayer de la définir de façon un peu objective et pas juste par
l'impression subjective de la difficulté à apprendre la langue ou à
mémoriser ces tableaux, mais je commence par des remarques un peu
éparses.)
Je ne m'intéresse pas du tout au sens des traits
grammaticaux. Comme je l'ai écrit dans l'avertissement liminaire,
pour ce que je raconte ici, peu importe ce que c'est qu'un cas,
ou ce que signifient le nominatif, l'accusatif,
le génitif ou le trucbidulatif, peu importent que les temps du
verbe s'appellent présent, passé et futur ou des
choses plus bizarres comme aoriste ou prétérit, peu
importe que parfait et inchoatif soient des temps
ou des aspects, tout ça est hors de propos ici : ce sont juste
des étiquettes arbitraires que la grammaire utilise pour décrire des
façons de modifier un lexème. Je parle juste de la complexité de
répondre à des questions du
genre[#5] :
En français, quelle est la 3e personne du singulier de l'indicatif
présent des verbes coudre et résoudre ?
(Réponses : il coud et il résout.)
En latin, quel est l'ablatif singulier du
nom animal ?
(Réponse : animali.)
En grec classique, quelle est la 1re personne du pluriel de
l'optatif futur moyen du verbe βάλλω ?
(Réponse : βαλοίμεθα.)
En russe, quel est l'instrumental du
nombre со́рок [sórok] ?
(Réponse : сорока́ [soroká].)
En irlandais, quel est le génitif singulier du nom
féminin an talamh ?
(Réponse : na talún.)
En sanskrit classique, quelle est la 2e personne du singulier de
l'impératif (présent) actif du verbe द्विष्
[dviṣ] ? (Réponse : द्विड्ढि [dviḍḍhi].)
En arabe classique, quelle est la 3e personne du singulier
masculin de l'inaccompli actif du verbe وَفَى
[wafá] ? (Réponse : يَفِي [yafī].)
[#5] À part l'arabe,
toutes mes langues sont indo-européennes : c'est essentiellement juste
un biais de ma part, même s'il semble quand meme plausible que les
langues indo-européennes aient tendance à avoir une complexité
inflexionnelle plutôt plus importante que la moyenne (si tant est que
« la moyenne » ait un sens). Encore une fois, ça ne veut pas
forcément dire qu'elles aient beaucoup de formes, plutôt beaucoup
d'irrégularités : les inflexions du turc, de ce que je comprends, sont
globalement très régulières, donc plutôt plus simples que celles des
langues indo-européennes typiques. Bien sûr, quand je dis plutôt
plus complexes que la moyenne, ça ne veut pas dire que ce soit le
maximum, loin de là : les gens ayant tenté d'apprendre le géorgien
doivent certainement rigoler que je décrive les conjugaisons du grec
ancien comme compliquées.
Pas sûr que mes réponses ci-dessus soient correctes, mais ça fait
justement partie de ce dont je veux parler : quelles sources consulter
pour trouver les bonnes réponses ?
Au sujet des notes de cours signalées dans
le billet précédent, on me fait
remarquer en commentaire, d'ailleurs pas très agréablement, que j'ai
écrit intention (dans le contexte d'un contraste
avec extension) là où je voulais sans doute
écrire intension. Alors, est-ce une erreur, ou quelle écriture
est-elle préférable ? À vrai dire je m'y perds assez.
Bon, déjà en général je déteste ces mots en -/sjɔ̃/ dont on je sait
jamais si on doit les écrire -tion ou -sion (sans parler
des différences
gratuites entre l'anglais et le français, comme le fait
que contorsion, distorsion et extorsion et
parfois distensionmais pastorsion s'écrivent,
en anglais, avec -tion là où le français met -sion : comment
voulez-vous retenir quelque chose de
pareil[#0] ?). Donc déjà le
fait qu'on ait extension avec -sion mais intention avec
-tion, tandis que distension hésite, est vraiment pénible.
Mais peut-être justement qu'il y a deux mots
distincts, intention et intension ? C'est là que ça
devient hautement confus.
[#0] Digression
() : Comme on me le signale en commentaire,
j'oubliais aussi l'hésitation entre -ction et -xion : annexion
mais exaction, complexion mais élection. Bon,
encore, ceux-là on peut les retenir au fait qu'il y a des
mots annexe et complexe. Mais parfois le français et
l'anglais font des choix différents, ou bien l'anglais
hésite : connexion, inflexion, réflexion, génuflexion
et peut-être parfois même flexion lui-même s'écrivent, en
anglais, avec -ction, au moins en anglais américain parce que
l'anglais britannique hésite plus, alors que le français met -xion.
(Le fait que connexion s'écrive -xion en français et -ction en
anglais peut se retenir au fait que connexe en français se
dit connected en anglais,
mais reflex existe bien en anglais sans que ça
empêche d'écrire reflection. Soupir.)
Indubitablement, certains dictionnaires contiennent bien un
mot intension (qui n'est pas le même que intention). Ou
peut-être même qu'il y a plusieurs mots intension différents ?
La 5e édition (1798) du Dictionnaire de l'Académie française
donne : INTENSION. sub. fém. Terme de Physique. Force, véhémence,
ardeur. L'intension de la fièvre. — ce qui ne m'aide pas
et ce qui n'est clairement pas le sens que je veux, et de toute façon
ce mot semble avoir mystérieusement disparu des éditions ultérieures.
Au moment où j'écris,
le TLF en
ligne semble en rade, donc je ne peux pas vérifier s'il a le
mot intension et avec quel
sens[#]. Mais
dans Wiktionary en
français, on trouve intension \ɛ̃.tɑ̃.sjɔ̃\ féminin
1. (Logique) Désignation d’un ensemble d’éléments par un
prédicat qu’ils vérifient. En anglais,
le American Heritage Dictionary of the English
Language me dit : in·ten·sion
(ĭn-tĕnʹshən) n.1. The state or quality of being
intense; intensity. 2. The act of becoming intense or more
intense; intensification. 3.Logic. The sum of the
attributes contained in a term.
[Latin intēnsiō, intēnsiōn-,
from intēnsus, stretched.
See intense.]
— in·tenʹsion·aladj. Et
dans Wiktionary en
anglais, je lis : intension
(plural intensions) […] 2. (logic, semantics) Any
property or quality connoted by a word, phrase or other symbol,
contrasted with actual instances in the real world to which the term
applies.
[#] Voici : INTENSION, subst. fém. A. -
Vx. Force, ardeur. L'intension de la fièvre (Ac. 1798). B. - LOG.,
LING., vieilli. Synon. de compréhension (d'un concept, d'un terme).
Anton. extension. Plus l'intension d'un terme (le nombre de traits)
est grande, plus l'extension (la classe des objets dénotés) est
restreinte. Il faut plus de traits pour définir hêtre que pour
définir arbre, mais il y a dans l'univers observé plus d'arbres que de
hêtres (MOUNIN 1974).
Voilà qui ne m'aide pas des masses, et honnêtement je ne comprends
pas vraiment ces définitions.
L'étymologie n'est pas d'un grand secours non plus. En
latin, intēnsiō et intēntiō
existent tous les deux, mais ils ont l'air vaguement
interchangeables. Le
Gaffiot
donne : intensĭo, ōnis,
f. (intendo), action de tendre, tension — et
il donne un plus grand nombre de sens
pour intentĭo, mais le premier est le même. (À
ce sujet, le
Gaffiot a
aussi les deux mots extensĭo
et extentĭo, mais là l'un renvoie simplement à
l'autre ; ça suggère en tout cas qu'il n'y a pas vraiment de raison
étymologique forte au fait d'écrire extension avec -sion
et intention avec -tion.)
Bon alors qu'est-ce que c'est que cette histoire du
mot intension et quel est son sens en logique ?
Je ne suis pas sûr de comprendre le sens général.
Le sens dans lequel je l'utilisais (avec l'orthographe en -tion,
mais peut-être que je vais changer) dans mes notes est le suivant : si
on a un programme/algorithme qui calcule une fonction, alors ce
programme/algorithme est l'intention (ou peut-être justement
plutôt l'intension, donc… bon, écrivons intenſion comme
une sorte de compromis) tandis que la fonction calculée est
l'extension. C'est important de faire la distinction parce
qu'une même fonction peut être calculée par toutes sortes
d'algorithmes différents. (Et
le théorème de
Rice nous dit essentiellement qu'on ne peut rien dire de
non-trivial — calculablement et à coup sûr — sur l'extension rien
qu'en regardant l'intenſion.)
En théorie des ensembles, l'extension d'un ensemble, c'est
justement l'ensemble de ses éléments. Et l'axiome d'extensionalité
nous dit que deux ensembles ayant les mêmes éléments sont égaux (dans
l'autre sens ça fait partie de la définition même de l'égalité).
L'intenſion, si je me base sur la définition donnée par Wiktionary, ce
serait une propriété définissant l'ensemble implicitement : par
exemple {0,1,2} serait un ensemble défini en extension alors que
{n∈ℕ : n≤2} serait le même ensemble définit en
intenſion.
Déjà, je ne suis pas franchement convaincu que les deux sens
décrits aux deux paragraphes précédents soient exactement le même, ni
quel serait le sens général. Mais l'idée approximative est que
l'extension est une description explicite (d'une fonction par
ses valeurs, d'un ensemble par ses éléments) de l'objet désigné, alors
que l'intenſion est une description par une caractérisation
du sens, ou quelque chose comme ça.
Du coup, je peux très bien rapprocher ça du mot intention au
sens de volonté de faire quelque chose : en décrivant un
algorithme pour une fonction, je veux fabriquer cette fonction, donc
l'algorithme est l'intention qui produit la fonction. Ceci
justifierait d'écrire le mot en -tion et de l'identifier avec le mot
usuel intention (but, volonté).
[Ajout :] Ce qui est
bizarre, c'est qu'il y a une distinction que je comprends bien, c'est
celle entre extensif et intensif : extensif fait
référence à quelque chose qui tend à s'étendre, i.e., tendu vers
l'extérieur, alors qu'intensif fait référence à quelque chose
qui tend à s'intensifier (← oui, OK, c'est une
lapalissade), i.e., tendu vers l'intérieur. Je comprends par exemple
bien la différence entre agriculture extensive (qui utilise de
l'espace) et agriculture intensive (qui maximise ses rendements
à surface donnée) ou, en physique, entre une grandeur extensive
(qui double quand on double la quantité de choses considérées, p.ex.
la masse ou le volume) et une grandeur intensive (qui reste la
même quand on double la quantité de choses considérées, p.ex. la
température ou la pression). Mais cette distinction extensif/intensif
(pour laquelle je n'ai aucun doute sur l'orthographe en -s-) semble
avoir assez peu de rapport avec la distinction extension/intenſion
dont je parle ici (en tout cas je ne vois pas pourquoi l'un
correspondrait à tendre vers l'extérieur et l'autre vers
l'intérieur).
Une explication plus détaillée, mais dont honnêtement je ne
comprends las bien les subtilités, sur la distinction
entre extensionnel et intenſionnel en logique ou en
philosophie
est sur
cette page de la Stanford Encyclopedia of
Philosophy
et celle-ci
sur Wikipedia (voir
aussi cet
autre passage sur Wikipédia s'agissant précisément des théories
des types intuitionnistes ; je sais que Martin-Löf en a inventé
plusieurs qu'on désigne justement en en qualifiant certaines
d'extensionnelles et d'autres d'itenſionnelles). Mais je trouve que
tout ça est plus confus qu'éclairant (disons que j'ai l'impression
confuse qu'on mélange plusieurs distinctions qui ne sont pas la même,
notamment le fait de décrire un objet par son identité ou par une
caractérisation, et le fait de s'intéresser à des égalités
contingentes ou nécessaires, ce qui sont deux questions qui me
semblent sans rapport).
Un exemple qu'on donne souvent, mais là aussi je ne suis pas sûr de
pouvoir le relier clairement aux usages évoqués ci-dessus, est quelque
chose comme le syllogisme fallacieux suivant (attention, divulgâchis
concernant le film Star Wars) :
Luke Skywalker veut devenir comme son père.
Darth Vader est le père de Luke Skywalker.
Donc : Luke Skywalker veut devenir comme Darth Vader.
Si on veut expliquer l'erreur en parlant d'extension et
d'intenſion, l'idée est que bien que Darth Vader soit le père de Luke
Skywalker en extension (ce sont la même personne), l'intenſion, au
moins dans la tête de Luke, est différente, puisqu'il n'a pas cette
information (ou même quand il l'a, il y pense différemment). Donc on
ne peut pas substituer une égalité extensionnelle dans un énoncé qui
dépend des intenſions.
(Mais à vrai dire, moi, j'aurais plutôt tendance à analyser ça en
termes de logique modale et mondes possibles : le fait que dans un
monde donné on ait x=y, n'est pas la même chose
que de dire que x et y
sont nécessairement égaux, c'est-à-dire égaux dans tous les
mondes possibles, et notamment dans le monde que Luke a dans sa tête.
Ce n'est pas clair pour moi si cette analyse en termes de logique
modale et mondes possibles soit compatible avec l'analyse en terme
d'extension/intenſion que je viens de donner.)
Là aussi, je n'ai pas trop de mal à identifier le mot que je
persiste à écrire intenſion pour signifier mon doute sur
l'orthographe, avec le mot intention tout à fait habituel et
qu'on écrit -tion de façon standard : on parle justement des
intentions de Luke. Pourquoi une orthographe différente ?
Du coup je ne sais toujours pas si intension est une
variante orthographique du mot intention qui s'est spécialisée
dans ce sens bizarre en philo / logique / linguistique, ou si c'est un
mot distinct (même si, in fine, ils viennent quand même de la
même origine latine).
C'est peut-être comme mise en abyme, qui est juste une
variante graphique de abîme, mais c'est quand même le même mot.
(En l'occurrence, il semble que ce soit André Gide qui ait popularisé
cette expression dans son sens figuré, avec cette orthographe
particulière : ça vient de l'héraldique mais il n'y a pas spécialement
de raison de préférer l'orthographe en ‘y’. Ceci étant, maintenant
qu'elle s'est imposée, on peut trouver que ce n'est pas plus mal
d'avoir cette spécialisation.)
Maintenant, comme il y a indubitablement des gens qui utilisent
scrupuleusement l'orthographe intension pour les différents
sens que je n'ai pas réussi à rendre très clairs ci-dessus, peut-être
que c'est une bonne idée de se rallier à cette convention comme on
peut choisir d'écrire mise en abyme avec ‘y’ même s'il n'y a
pas de raison étymologique à le faire.
Ceci étant, on peut se demander comment est apparue cette
écriture intension avec ce sens (je veux dire, celui de la
philo / logique, pas celui donné par l'édition de 1798 du Dictionnaire
de l'Académie), indépendamment du fait que ce soit ou non un mot
distinct de intention. L'article de
la Stanford Encyclopedia of Philosophy cité
ci-dessus semble dire que
c'est Carnap
le coupable. (The Port-Royal Logic used terminology
that translates as “comprehension” and “denotation” for this. John
Stuart Mill used “connotation” and “denotation.” Frege famously used
“Sinn” and “Bedeutung,” often left untranslated, but when translated,
these usually become “sense” and “reference.” Carnap settled on
“intension” and “extension.” However expressed, and with variation
from author to author, the essential dichotomy is that between what a
term means, and what it denotes.) Mais
la Wikipédia
en allemand évoque aussi Leibniz, qui aurait alors certainement
l'antériorité sur Carnap.
Évidemment, si l'inventeur du terme (qu'il s'agisse de Carnap ou
Leibniz) écrivait en allemand, langue dans laquelle intention
se dit Absicht (même
si Intention se trouve aussi), le fait d'avoir
choisi l'écriture Intension comme pendant
à Extension n'est pas aussi significatif qu'en
français ou en anglais.
Quoi qu'il en soit, je reste assez dubitatif sur la question de si
on doit considérer que intension est un mot distinct
de intention, comme sur celle de savoir si on doit se tenir à
cette orthographe (cette fantaisie de Carnap comme abyme en est
une de Gide ?), et, en fait, sur la signification (ou peut-être
la significasion ?) générale de cette histoire
d'intenſionalité.
J'avais parlé il y a quelques années
de ma fascination pour les
constitutions, et de l'intérêt à la fois politique, argumentatif
ou illustratif, mais aussi artistique, d'imaginer des constitutions
(d'états réels ou fictifs) même si on ne pense pas une seule seconde
que ces constitutions aient la moindre chance d'être mise en pratique,
et j'avais évoqué, sans la développer, la comparaison avec la création
de langues artificielles, qui éveille un peu les mêmes cellules
mentales chez moi. Je voudrais reprendre ce fil de pensée et
expliquer ici l'intérêt que peuvent avoir les langues construites, et
défendre la thèse que la linguistique peut légitimement s'y
intéresser. (J'écris peut plutôt que doit dans la
phrase précédente, mais ce que je veux surtout dire c'est que je me
place en opposition de l'attitude que je crois avoir perçue de temps
en temps — je ne l'attribue à personne parce qu'il est possible que je
simplifie une position plus nuancée et pas forcément si méprisante —
que les langues artificielles sont un joujou pour amateurs qui ne peut
en aucun cas informer le travail du linguiste qui consiste à étudier
les langues naturelles et leur évolution naturelle ; ou encore — de
nouveau, je résume quelque chose que je crois avoir retenu, quitte à
risquer de brûler des hommes de paille — que les langues construites
ont autant à apprendre aux linguistes que les fleurs en plastique aux
botanistes.)
☞ Qu'est-ce qu'une conlang
Pour commencer par définir les termes, j'utiliserai langue
artificielle et langue construite de façon interchangeable
(on peut certainement vouloir faire une nuance, mais je n'aurai pas
besoin d'une terminologie trop pointilleuse), et j'utiliserai
l'anglicisme/néologisme conlang de façon également
interchangeable pour aller plus vite.
Une conlang, donc, et même si je vais dire tout de suite
que la distinction n'est pas toujours parfaitement claire, c'est une
langue qui a été créée de toutes pièces plutôt que, comme les langues
naturelles, évoluer organiquement, progressivement, par la
communication mutuelle. Si on veut, on peut comparer l'évolution des
langues naturelles à l'évolution des organismes vivants (il y a un
processus de mutation et de sélection, même si les raisons de l'une
comme de l'autre ne sont pas aussi bien expliquées que dans le cadre
de l'évolution darwinienne de la vie au-dessus des principes de
l'écologie, de la génétique, et de la biochimie), alors que les
langues construites s'apparenteraient, dans cette analogie, plutôt à
des robots ou des mannequins.
☞ Quelques exemples
La conlang la plus connue est évidemment
l'espéranto
(conlang au moins à l'origine, parce qu'on peut certainement contester
que l'espéranto soit encore une conlang à ce stade), connue
entre autres pour la manière pénible dont ses aficionados voudront
vous expliquer que c'est la solution de plein de problèmes de
l'humanité (bref, l'espéranto est un peu aux langues humaines ce que
le Python est aux langages informatiques), et inversement dont les
détracteurs aiment se moquer. Si vous voulez voir des critiques assez
intéressantes de l'espéranto, voyez par
exemple cette page
ou celle-ci (deux pages qui ont d'ailleurs disparu et c'est
heureux que l'Internet Archive en
ait préservé l'information), mais
en l'occurrence ce qui est surtout pénible avec l'espéranto c'est la
manière dont les débats autour de lui font oublier toutes les autres
conlangs. (J'ai notamment l'impression que
l'article
de la Wikipédia en français sur les langues construites est en bonne
partie résultat d'une guerre d'édition entre les espérantistes qui ont
voulu en profiter pour expliquer à quel point leur langue préférée est
géniale et les anti-espérantistes qui ont voulu en profiter pour la
critiquer.)
Un autre exemple de conlang que je pourrais mentionner (ne
serait-ce que pour souligner que ce n'est pas pareil que l'espéranto)
est
l'interlingua
(j'ai d'ailleurs écrit au moins un
billet de ce blog dans cette langue), une sorte de point de
rencontre des langues latines (mais dont le vocabulaire vise à trouver
une forme systématique de chaque mot, là où Zamenhof semble avoir
choisi le vocabulaire de l'espéranto en tirant au hasard au dé s'il
allait utiliser une racine romane, germanique ou slave), et qui vise —
avec quel succès, c'est discutable, mais vous pouvez lire le billet
que je viens de lier pour tester — à être immédiatement compréhensible
par n'importe quel locuteur d'une langue latine, sans apprentissage
préalable. Il y a des tentatives d'analogues de l'interlingua pour
les langues slaves
(l'interslave)
et, de façon moins aboutie, pour les langues germaniques (le
folksprak).
Encore d'autres exemples de conlangs sont la famille des langues
elfiques inventées par Tolkien pour le monde de la Terre du Milieu
(dans lequel se déroulent le Seigneur des Anneaux), ou le
klingon du monde de Star Trek. Encore plus d'autres
exemples sont fournis par
le lojban, une
langue dont la grammaire vise à être aussi parfaitement logique et
inambiguë que possible,
le toki pona, une
langue minimaliste qui n'a que 137 mots essentiels et qui s'apprend en
un temps record, ou encore
l'ithkuil, une
langue plutôt maximaliste et sans doute trop compliquée pour être
apprise. Bref, les exemples sont très nombreux, et bien
sûr il
y a une liste sur Wikipédia.
Et cette page Wikipédia ne mentionne bien sûr que les conlangs les
plus connues ou attestées. Énormément de geeks intéressés par la
linguistique ont imaginé leur propre conlang, voire des dizaines de
conlangs, soit pour s'amuser, soit pour faire
du world-building (cosmopoésie ?) dans un
monde où ils situent des histoires de fiction, ou pour je ne sais
quelle autre raison. Quand j'étais ado, j'ai inventé diverses
conlangs, par exemple toutes sortes de variations autour
de l'indo-européen réimaginé par Ruxor (où je cherchais à
coller à peu près avec les sources que je pouvais trouver sur ce qu'on
sait du proto-indo-européen — et qui étaient disponibles à l'ado d'une
époque où Wikipédia n'existait pas et qui n'avait pas accès à une
bibliothèque de recherche en linguistique — mais en assumant
pleinement d'inventer les formes qui me manquaient ou qui me
semblaient artistiquement ou logiquement nécessaires). J'ai peur que
toutes ces créations de moi aient été irrémédiablement perdues, mais
comme exemple plutôt intéressant de langue inventée par un geek dans
son grenier, je recommande de
regarder cette vidéo qui est
assez impressionnante par la quantité
de world-building (pas uniquement sur le plan
linguistique) que la langue en question nous laisse deviner (et le
fait que la langue en question soit une conlang non seulement dans
notre monde réel mais aussi d'une certaine manière dans le
monde fictionnel où elle se place, peut être considéré comme un
magnifique exemple
de métafiction) : j'avoue que je
suis franchement admiratif.
Mais bon, reprenons.
☞ Trois buts possibles d'une conlang
Quels sont les buts possibles d'une langue construite ? J'en vois
principalement trois (et je vois que Wikipédia tombe sur la même
typologie que moi, donc elle a sans doute une certaine naturalité),
pas forcément exclusifs ni exhaustifs mais permettant de délimiter au
moins approximativement le terrain : ① la communication, comme c'est
le cas de l'espéranto ou de l'interlingua, ② l'art, comme c'est le cas
des langues elfiques de Tolkien, et ③ l'exploration ou l'illustration
d'une théorie ou hypothèse linguistique, comme c'est le cas du lojban,
du toki pona ou de l'ithkuil.
☞ But ① : la communication
But ① (que tout le monde aura immédiatement en tête) : la
communication. Pour ça, il faut bien sûr espérer que des gens
apprennent la langue en question et décident de s'en servir (on peut
éventuellement espérer, comme le fait l'interlingua, que la langue
puisse servir de façon passive — c'est-à-dire pour comprendre
un texte déjà écrit ou parlé — à des gens qui ne l'auraient jamais
apprise, mais pour se servir d'une langue de façon active —
c'est-à-dire pour écrire ou parler — il est assez inévitable qu'il
faille apprendre quelque chose). Généralement l'idée est alors de
créer une langue simple, soit parce qu'elle est régulière et logique
(ce qui permet à peu de concepts d'avoir énormément de portée), soit
parce qu'elle est minimaliste (ce qui minimise la quantité
d'apprentissage nécessaire), soit parce qu'elle se rapproche de
langues naturelles qu'on suppose déjà familières à la personne ciblée
(cas des langues romanes avec l'interlingua). L'espéranto, notamment,
qui vise clairement à servir de langue véhiculaire, met souvent en
avant la puissance de son système d'affixes (ce qui permet de dire
beaucoup de choses avec peu d'outils) ou la régularité de sa
grammaire.
Il faut être honnête : à part peut-être dans un cadre extrêmement
spécifique, ça ne marchera pas. Essentiellement personne n'a envie
d'apprendre une langue construite pour communiquer avec les autres,
parce qu'essentiellement personne ne parle ces langues construites :
c'est peut-être dommage, mais c'est un cercle vicieux qu'il est
impossible de briser.
Mais le but d'une conlang n'est pas forcément d'être apprise et
parlée !
☞ But ② : l'art
But ② : l'art. Dans le cas des langues elfiques de Tolkien, ou du
klingon, ou du dothraki (de Game of
Thrones), il s'agit de langues que j'ai qualifiées
de world-building, c'est-à-dire destinés à
étoffer un monde fictionnel, à lui donner de la crédibilité et de la
complexité. Mais l'art peut aussi porter sur l'esthétique de la
langue elle-même : on peut décider de créer une langue comme une œuvre
d'art en soi, sans aucun lien avec un monde fictionnel, pour
ses sonorités, pour son élégance, n'importe quoi d'autre. Le mot
français poésie vient du grec ποίησις,
création, fabrication (de ποιέω, créer,
produire, causer, fabriquer) : la glossopoésie c'est l'art de créer
des langues, qui peut être un art pour l'art, sans avoir besoin
d'être sous-tendu par la nécessité de peupler un monde imaginaire.
Je pense que la plupart des conlangs de geeks rentrent plutôt dans
cette catégorie-là : on crée une langue pour le plaisir de créer une
langue, pour savoir ce que ça fait de créer une langue. Et comme
beaucoup de formes de création artistique, il faut de l'inspiration,
mais il faut aussi du travail, au sens où la première conlang qu'on
crée ressemblera beaucoup à l'équivalent linguistique de ce que les
dessins de maternelle sont aux arts graphiques. (On peut aimer, bien
sûr : la qualité de l'art ne se juge pas à la perfection technique, et
si on crée pour soi-même la seule chose qui importe est le plaisir
qu'on y prend, mais disons que la perfection technique se sent comme
le manque de celle-ci se sent aussi, et en créant des conlangs on
progresse dans cette capacité. J'étais tombé
sur cette vidéo d'un conlanger qui est assez intéressante,
malgré son excès d'autoflagellation, pour mettre en lumière les
« erreurs du débutant ». Et puis je me suis bien livré
à un exercice du même style sur mes
romans d'ados.)
Quelques réflexions sur le genre grammatical et l'écriture inclusive
M'étant suffisamment énervé sur Twitter au sujet du pass sanitaire,
je voudrais me calmer les nerfs en écrivant un billet de blog sur un
sujet qui ne peut qu'apporter la paix et la concorde dans les foyers —
en évoquant l'écriture inclusive.
De façon générale, l'écriture inclusive est une façon d'écrire une
langue donnée (et qui pose plus ou moins de difficulté selon la langue
en question) qui cherche à accomplir quelque chose comme les buts
suivants :
ne pas faire de présupposé sur le genre ni du locuteur, ni de la
personne adressée, ni d'une tierce personne dont il serait
question,
éviter de propager des présupposés sur le genre des personnes en
question, voire lutter contre des préjugés déjà installés (par exemple
en attirant l'attention sur le fait qu'une personne pratiquant tel ou
tel métier peut être une femme comme un homme).
Certaines langues ne posent aucun problème, au moins pour ce qui
est du premier point, parce qu'elles n'encodent aucune information de
genre sauf dans des mots optionnels servant explicitement et
expressément à donner cette information. (Et je ne cacherai pas que
c'est la situation que je préfère.) À l'extrême inverse, on a des
langues dans lesquelles on ne peut essentiellement rien dire, même des
énoncés aussi simples que je mange ou tu marches
ou cette personne a des yeux noirs sans donner au passage
l'information de si la personne dont on parle est catégorisée comme
« homme » ou comme « femme ». J'espère ne pas dire des bêtises (on me
corrigera le cas échéant, ou on me donnera de meilleurs exemples),
mais il me semble que le hongrois ou le japonais sont à peu près
idéales dans le sens de non divulgation inutile d'informations de
genre ; tandis que l'hébreu doit être assez loin dans l'extrême
inverse. L'anglais est dans une situation relativement modérée, le
problème venant principalement des pronoms
genrés he et she : il y a
bien des noms communs genrés (comme policeman)
mais au moins cette langue n'éprouve pas le besoin de genrer qui que
ce soit dans une phrase comme I was invited by a
friend, tandis que le français souffre d'une propension beaucoup
plus aiguë à tout genrer (j'ai été invité chez un ami ? j'ai
été invitée chez un ami ? j'ai été invité chez une
amie ? j'ai été invitée chez une amie ?). Je vais revenir
ci-dessous sur la question du fait que le français attribue un genre
grammatical à tous les noms communs, même inanimés (le
fauteuil, la chaise), et la nécessité de démêler ce phénomène
de catégorisation grammaticale arbitraire de la manière dont les
individus sont souvent obligatoirement genrés par des énoncés à leur
sujet.
L'absurdité de cette révélation forcée d'information de genre est
mise en lumière de façon extrêmement frappante, je trouve,
dans cet essai satirique par
Douglas Hofstadter, que je recommande de lire avec attention parce
qu'il est (je trouve) absolument génial et contient énormément de
références amusantes (comme le titre Person
Paper, qu'il faut comprendre
comme White
Paper). Il imagine un monde parallèle où le langage
obligerait à catégoriser les personnes non pas selon leur genre mais
selon la couleur de leur peau : l'auteur imaginaire, avec beaucoup de
mauvaise foi, défend l'idée que toutes sortes de ces pratiques
linguistiques ne sont pas du tout racistes, mais simplement
historiques (comme le fait de dire policewhite
pour n'importe quelle personne travaillant dans la police, et plus
généralement de dire white là où dans notre
univers on dit man), puisque maintenant il est
fermement acquis, dixit, que blancs et noirs sont égaux (et
dans une jolie mise en abyme, évoque ce que serait la situation d'une
langue où les personnes seraient catégorisées par leur genre).
Personnellement, ce texte a fait beaucoup plus pour me convaincre de
la pertinence de la recherche d'une forme d'écriture d'inclusive que
n'importe quelle injonction moralisatrice (et je crois que c'est
depuis que je l'ai lu que j'ai adopté le they
singulier en anglais, cf. ci-dessous).
Obliger à genrer les individus pour un énoncé qui n'a rien à voir
n'est pas juste problématique par le fait qu'on ne veut pas forcément
révéler cette information qui dans l'immense majorité des cas est
complètement sans intérêt : il existe aussi des situations où ce n'est
pas du tout évident ou véritablement indésirable. Les personnes
non-binaires sont pour ainsi dire sommées de choisir une catégorie qui
ne leur convient pas. Une histoire qui serait racontée par un robot
ou un message affiché par un ordinateur pourra dans certains cas
(selon l'énoncé ou la langue) avoir à catégoriser ces machines comme
masculines ou féminines, ce qui est absurde. Dans un roman policier,
le genre de telle ou telle personne au sujet de laquelle est donnée
une information est justement quelque chose qu'on peut ne pas vouloir
révéler. (J'avais commencé à écrire une histoire dans laquelle je
voulais ne pas révéler si le narrateur était un homme ou une femme, et
j'ai trouvé ça beaucoup moins difficile en anglais qu'en français, et
même en anglais ce n'était pas complètement évident.)
Il est vrai qu'il ne faut pas blâmer le langage pour tout : notre
culture fait que nous genrons beaucoup de choses dans nos têtes
souvent sans nous en rendre compte. Le film de Pixar de
2006, Wall·e (dont le titre évoque, complètement
accidentellement mais fort opportunément, un système d'écriture
inclusive en français !) l'a par exemple montré de façon frappante par
le fait qu'énormément de gens, moi compris, ont spontanément
interprété Wall·e comme un personnage masculin et Eve comme un
personnage féminin, alors que d'une part ce sont des robots donc ça ne
veut rien dire du tout, et même si on veut leur attribuer un genre
binaire, il n'y a rien d'explicite dans la film qui soutienne plus
l'une des quatre combinaisons imaginables que les autres (j'ai
vaguement le souvenir d'avoir lu quelque part — mais je ne retrouve
plus où — que les animateurs de Pixar avaient exprès utilisé pour
Wall·e toutes sortes de caractéristiques normalement attribuées aux
personnages d'animation féminins et pour Eve toutes sortes de
caractéristiques normalement attribuées aux personnages masculins,
mais apparemment ça n'a pas suffi pour retourner nos attentes).
D'autres exemples sont fournis par des devinettes du genre :
A boy and his father are involved in a car accident. The father
dies on the spot. The boy is rushed to the hospital. The surgeon
arrives and, upon seeing the patient's face, exclaims I can't
operate: he's my son! How is this possible?
My relation to English, bilingualism, and this blog
For a change, this blog entry will be in English, and will be about
this very fact; or rather, about the fact that it is unusual, because
I very rarely write in English here nowadays. Even though I had
started this blog (in 2003) with
the intention of making it bilingual (in the sense that some posts
would be in English, others in French, and still others translated in
both languages), I really can't say I kept this “promise”, and the
present entry is a kind of apology, excuse, or at least, explanation,
for that fact. Yesterday I rewrote the introductory blurb displayed,
before the content itself, at the top of various pages (e.g., the
page listing the most recent entries), and the last
remnants of this old pretense of bilingualism have been swept away.
But why?
Before I get into this, I need to say something about my personal
relation to English, how I learned the language, and how well I speak
it. I had written something about this
in this other entry, also in
English and also about English, but I should elaborate a bit.
And by elaborate a bit, I mean make an epic rant of
it.
Well, it's Complicated®. One tends to classify speakers of a
language into “native” and “non-native” categories.
The Simple
English Wikipedia (there is a kind of irony here) suggests the
criteria for being classified as a “native” speaker are some
combination (logical conjunction?) of the following:
the speaker learnt the language in childhood,
mastery of idiomatic forms of the language,
comprehension of regional and social variance,
fluent, spontaneous production and comprehension of discourse.
I think I can tick all four boxes, but each time with a
slight caveat.
How did I learn English? My father is an English-speaking Canadian
(he was born in Saskatoon and grew up mainly in Ontario), who moved to
Europe in the early '60's, and learned French there, and also met my
mother, who is French and whose native language is French. I have
dual Canadian and French citizenship. For some reason (which they
themselves are not able to adequately explain, but which is certainly
related to the way society has evolved in how it considers
bilingualism), my parents only spoke French to me when I was a
toddler. However, when I was 8, we moved to Toronto for the 1984–1985
academic year, and I attended third grade in (the English-speaking)
Cottingham public school, Summerhill, Toronto. I remember there
having been some discussion as to whether I would attend a
French-language school, an English-language one, or a bilingual one: I
was offered the choice, and I opted for the English one, which was
mere minutes' walk away from where we lived, after we had ascertained
that the schoolteacher had some knowledge of French and that she was
able and willing to help me learn English. (And I owe a lot to
Mrs. Marr, who, indeed, made a lot of efforts getting me to speak
English very quickly, and also realized that I didn't need any of the
math classes she taught and let me use that time to improve my English
instead. It also helped that my fellow schoolchildren were very
welcoming toward the stranger that I was and readily accepted me as
one of their peers. Perhaps the only time I regretted my choice of
going to an English-speaking school was the very first day of class,
when the teacher had forgotten that she had a French pupil in class, I
realized that I understood almost nothing of what was being said or
asked of us, did not dare walk up to the desk and ask, and ended up
just crying on the spot. But once this slight initial trauma had
passed, all went well.)
I did have some slight exposure to English before the age of 8, not
only because I must have heard my father speak the language (just not
at me), but also because, in preparation to the move to Toronto, my
parents enrolled me in a private English class in Orsay. I guess the
teacher must have been British, my memories are obviously quite vague
on the subject. Anyway, I had very rudimentary knowledge of English
before then[#], but I only
really learned it in 1984.
[#] There was a point
when — I must have been around 6 — someone asked me whether I spoke
English, and, ever the logician, I answered my German is
better. Which meant that I must have known two words of English
and three words of German, so it was technically accurate (the best
kind of accurate, they say).
Is 8 young enough to be considered childhood in the sense of
the aforementioned first bullet point? Probably, but with a caveat to
the effect that English is still only the second language I
learned.
When I look back upon that time, it seems that my transition from
“not speaking English” to “speaking English fluently” was
astonishingly fast[#2]. I
don't know exactly when the school year began, but I understood very
little English at this point, yet by the time of Halloween, so a mere
two months later, it seems I was getting along fine trick-or-treat-ing
in the neighborhood.
[#2] I should mention
at this point, however, that I am fully unconvinced by the theory
that, in identical circumstances, children learn languages much faster
and more easily than adults. I may seem to be contradicting my own
evidence, but the crucial qualifier is in identical
circumstances: not only do children have generally more time to
devote to the learning of a new language, but also, when they make
what prescriptivists would call mistakes, adults step in and
correct them, or their fellow children make fun of them, and they are
forced to learn quickly: this is simply not the case when adults learn
a foreign language, because it is impolite for other adults to
constantly interrupt and correct them (and the other adults generally
have other things to do than help them learn the language). See
also this
video, which makes a number of good points, for various bits of
evidence against the idea that kids learn languages faster than
adults.
From that point on, and even after we had returned to France, I
spoke English with my father, at least when my mother wasn't around.
I also read a lot in English, both fiction and non-fiction, and
learned a lot of vocabulary by reading.
But there are two issues with learning new vocabulary through
books. One is that, since English has essentially no relation between
the written and spoken form, I often didn't know how to pronounce the
words I learned and generally didn't bother to check in a dictionary
(and my guesses were occasionally wildly wrong: for example, for a
long time I thought genuine was pronounced /ɡəˈnaɪn/ instead of
/ˈdʒɛnjuˌɪn/). Another issue is that I only learned whichever words
were likely to come up in the books I read: since there was a lot of
heroic fantasy, I learned a lot of quaint or obsolete words, sometimes
with a faux medieval flavor (Tolkien's The Lord of the
Ring and its second-rate epigones use some deliberately archaic
manners of speech, whence I learned nouns like liege,
conjunctions like lest, adverbs like hither and so on).
But only few of the “normal, everyday” words which most native
speakers learn in the course of their daily lives beyond third grade
level: to this day I'm still not comfortable with the names of kitchen
utensils in English (and as for the names of trees and various
categories of animals, in my mind they are lumped in big categories
like, well, tree). To give a random example, I learned the
very common word bollard only very recently. Similarly, since
I didn't attend high school or university in an English-speaking
country, I'm unfamiliar with many of the terms specific to this
context beyond the basic ones like test, grade
and homework (which I guess are common to elementary school
anyway).
Films are probably better than books in this regard: for one, they
don't just teach you words, they also teach you how to pronounce them
(spelling is rarely the issue, and subtitles can be used when it is);
and for another, the language used tends to be more idiomatic than
that found in print. But before DVD's came long, it
wasn't so easy to watch movies in their original language, and even
once DVD's existed, original language subtitles were
rarely available.
Learning English after French, I've also had a number of
difficulties
with “false
friends”. Not so much in cases where cognate/analogous French and
English words have completely different meanings (deception
vs. déception, for example, or injury
vs. injure), as these are noticeable enough that
one inevitably ends up learning them, but rather in the far more
numerous cases where the two words do indeed have a similar meaning
but with a slightly different nuance or connotation, which can cause
subtle and hard-to-detect misunderstandings (to demand
vs. demander). Perhaps even more delicate is the
wealth of French words which sound like they exist in English, which
do exist in English (because English, you know, is a hoarder and
has all the words), which do have the same essential meaning
as in French, but are exceedingly rare or sound very pedantic: so even
if I'm careful and look up the word in a dictionary, the dictionary
will tell me that, yes, the word exists, then I go ahead and use it
and it sounds weird to English speakers because, who says that? (there
are probably much better examples than this, but remuneration
has essentially the same meaning as rémunération
in French, but the latter is fairly common whereas the former is about
ten times rarer if I believe Google Ngrams; the same is true
for ludic versus ludique:
apparently ludic is so rare in English
that someone
on Reddit thought it was a typo).
So we move to point number 2, mastery of idiomatic forms. Well, my
English is fairly idiosyncratic… but so
is my French! There is a lot of English that got its way into my
French, and there are imports from mathematical terminology, from
computer terms and geeks' jargon, from memes and private jokes, and so
on; I also like to deliberately jump from one level of formality to
another, sometimes within the same sentence, just to break
expectations about formality; generally speaking, my French is a
bizarre mix of everything I can get my hands on, and in a state of
permanent redesign. And the same holds true for my English.
Sometimes I'm being unidiomatic because I'm not sure what the most
common way of phrasing something might be: but often I'm deliberately
using an unidiomatic turn of phrase because I like it, because it
appeals to my sense of logic or creativity, or simply to piss off
grammar nazis. Because no matter how well or how little I speak a
language, I always like playing with it. For example, if English has
the word insofar, you bet I'm going to feel free to use the
analogous question inhowfar (= to what extent), not
caring if it's an unidiomatic calque of the
German inwiefern (in the same way
as insofern corresponds to insofar): I
love that German word and there's no way I'm not importing it into my
English. Similarly, you bet that if hitherto exists in a
temporal sense, you can bet I'm also going to use thitherto
and whitherto (or from hencefrom: thencefrom
and whencefrom). You get the picture. Anyway, reading this
entry will give a broad idea of how I express myself in English.
A little over a week ago, I launched
a not-at-all-scientific online poll on the pronunciation of
English vowels, in order to gain some insight into (a) how much we are
influenced by the written form of a word into how we think it is
pronounced, and (b) how well English pronunciation is taught to
foreigners, especially in France, and what vowel distinctions they
uphold — or think they do. I closed this poll on Wednesday after
receiving 259 responses, of which 77 self-reported as native speakers
and 182 as non-native speakers (there was also one entirely blank
answer, which is not included in these statistics). This is a
tabulation of results, along with some comments.
The poll consisted of 40 pairs of words (like pin / pen),
displayed in a (fixed but) randomly chosen order, and for each pair,
the respondent was asked whether they pronounce the words identically
or not, with the choice given between four possible
answers: identical, unclear / varies, distinct
or don't know (instructions were given to choose the don't
know answer when the respondent was not familiar with one of the
words or how to pronounce it).
For each of the 40 pairs, I give below a table showing (in the last
two lines), the proportion of the number of native and non-native
speakers (excluding the — never more than two — who skipped the
question altogether) who chose each of the proposed answers; the most
frequent answer in each category has been highlighted in green. The
first two lines of the table give, as an asterisk (‘✱’), the
“expected” answer for two (somewhat idealized or stereotypical)
standardized accents: English Received Pronunciation and General
American Pronunciation (sadly, I do not have any reliable dictionary
of Australian pronunciation at hand): the phonetic transcription used
to conclude this has been shown in the last column of these lines;
sometimes, a question mark has been added to indicate that notable
variant pronunciations make the answers in question also predictably
plausible (or plausibly predictable). I also added some comments as
to why the pair was included and what it was meant to test (and why,
in some cases, it was stupid of me to include it).
The poll also asked the respondent where they learned English (in
hindsight, it would have been better to also ask where they were from,
and, in the case of non-native respondents, what their native tongue
was; this suggestion was made in the comments, but I did not wish to
alter the questions once the poll had started). The distribution of
answers is as follows:
Native respondents (77): England 15 (including 6 from London, and
including 2 who did not specify beyond UK, but presumed
to be from England); United States 40 (mostly from California and the
Midwestern US; but a few did not disclose beyond the
country); Canada 4; Australia 12; New Zealand 2; others 1 (Wales and
Nigeria); no answer 3.
Non-native respondents (182): in overwhelming majority in France
(117 answered France, possibly with a more specific place;
another 9 included France as part of their answer); among the most
common answers not including France were Russia (10, plus 1 including
Russia), Germany (3) and a few other non English
speaking EU countries (17), and various
English-speaking countries (10).
In the comments below I will use expressions such
as native respondents from the US as a shortcut to
designate respondents who self-reported as native English speakers and
who answered the question of where they learned English with a place
in the US (or the US without further
information).
The highly skewed number of French respondents is due to the way
the poll was announced (on my blog, which is mostly in French, and
Twitter feed, which is partially in French).
English vowels are, of course, a mess (see
also this old entry), and there
isn't even any clear and definitive answer to how many
different vowels (phonemes?) English has, let alone how they should be
transcribed. The
“lexical sets”
chosen by John C. Wells (namely, the vowels of: KIT, DRESS, TRAP, LOT,
STRUT, FOOT, BATH, CLOTH, NURSE, FLEECE, FACE, PALM, THOUGHT, GOAT,
GOOSE, PRICE, CHOICE, MOUTH, NEAR, SQUARE, START, NORTH, FORCE, CURE)
are an attempt at forming a repertoire (but no accent has a different
vowel for each set, and conversely, some may subdivide some of the
sets; a lexical set like CLOTH has the same vowel as LOT
in RP and the same vowel
as THOUGHT in GA; vowels with a
following ‘r’ are generally classified separately; and the NURSE vowel
is not even a single vowel in Irish accents), so it is used in giving
the phonetic key below, and in discussions. I encourage learners of
English to memorize this set of words, try to keep apart those which
are indeed pronounced separately in the accent(s) they target (so,
probably forget about the distinction between NORTH and FORCE), and
try to note, whenever encountering a difficult vowel, which lexical
set it relates to.
The following phonetic key has been used in transcription; it is a
sort of hybrid between the one used in Wells's own Longman
Pronunciation Dictionary (with the notable difference that /ɛ/
rather than /e/ has been used for the DRESS vowel), and the one used
in Wiktionary (with the notable difference that some vowels have been
marked with ‘ː’ even in American where such distinction of length is
dubious):
KIT
DRESS
TRAP
LOT
STRUT
FOOT
BATH
CLOTH
NURSE
FLEECE
FACE
PALM
THOUGHT
GOAT
GOOSE
PRICE
CHOICE
MOUTH
NEAR
SQUARE
START
NORTH
FORCE
CURE
RP
ɪ
ɛ
æ
ɒ
ʌ
ʊ
ɑː
ɒ
ɜː
iː
eɪ
ɑː
ɔː
əʊ
uː
aɪ
ɔɪ
aʊ
ɪə
ɛə
ɑː
ɔː
ɔː
ʊə
GA
ɪ
ɛ
æ
ɑː
ʌ
ʊ
æ
ɔː
ɝː
iː
eɪ
ɑː
ɔː
oʊ
uː
aɪ
ɔɪ
aʊ
ɪɹ
ɛɹ
ɑːɹ
ɔːɹ
ɔːɹ
ʊɹ
It should be noted that, despite the transcription which
distinguishes them, most Americans now do not seem to separate the LOT
and THOUGHT vowels (this is the cot–caught merger), and,
conversely, a small handful still pronounce the NORTH and FORCE vowels
differently (in which case the latter might be transcribed /oːɹ/).
Caveat: While the percentages in
the tables have been computed automatically, everything else is
written by hand, and, as humans are prone to making mistakes and I am
exceptionally human, probably littered with mistakes of all sorts.
Percentages might not sum to 100% because of rounding, of course;
concerning rounding, I have rounded to the nearest integer or, in case
of a tie (which occurs fairly frequently because I had 40 native
respondents from the US and I often give the details for
those), to the nearest even integer.
This pair is homophonous in all English accents I know of. It was
included to test the effect of spelling differences, and as a possible
comparison with the farm /
form question.
Here
is an
online poll on the pronunciation of English vowels. It consists
of 40 pairs of words (like pin / pen), in no particular order,
and for each pair, the question is whether you pronounce them
identically or not. For example, if shown make / cake you
would hopefully say they are not pronounced identically, whereas if
shown know / no you would presumably say that they are (these
are examples with consonants, but my poll is essentially concerned
with vowels). If you are unfamiliar with one of the words or don't
know how to pronounce it, answer don't know; but if you aren't
sure whether they are identical, choose unclear / varies.
(The point of this not-at-all-scientific experiment is to
gain some insight into (a) how much we are influenced by the written
form of a word into how we think it is pronounced, and (b) how well
English pronunciation is taught to foreigners, especially in France,
and what vowel distinctions they uphold — or think they do.)
I am interested in answers from native and non-native speakers
alike. Note that there generally isn't any “correct” answer: many of
these pairs are
a shibboleth for
some particular kind of merger or split, some are for confirmation.
There are a few pairs which I expect no (or almost no?) native
speakers tell apart, and a few which I expect all (or almost all?) do.
So maybe some questions will seem like they're “easy” or “hard”, but
this is really meaningless.
Once I declare the poll over (which I will do when the number of
responses received stabilizes), I will publish the answers together
with “expected” answers for some reference pronunciations, comments on
why I included this or that particular pair, and comments on the
answers I actually received (hopefully from both natives and
non-natives if I get enough of both for some sort of statistical
relevancy to kick in).
Club Contexte : Communications Papier (ou pensées en vrac sur les lettres et leur forme)
Les communications papier dont je veux parler c'est, bien
sûr, l'écriture, mais le titre de cette entrée s'abrège
en CCCP, ce qui n'a absolument rien à voir
avec СССР qui est l'abréviation de Союз
Советских Социалистических Республик, autrement dit, de
l'URSS. Selon votre navigateur et les polices installées
sur votre ordinateur, le ‘C’ de Club Contexte
(U+0043 LATIN CAPITAL LETTER C) et
le ‘С’ de Советский Союз
(U+0421 CYRILLIC CAPITAL LETTER ES)
apparaîtront peut-être, ou peut-être pas, comme identiques. Ce sont
néanmoins des caractères différents pour Unicode, comme vous pouvez le
vérifier en recherchant ‘C’ dans cette page, ou en copiant-collant le
caractère et en le recherchant dans Google, ou quelque chose de ce
genre. (Hum, à vrai dire, ce serait peut-être le jeu de décider
que Club Contexte s'abrège en СС avec un ‘С’ cyrillique
— cyrillique, pas сyrillique. Mais comme le ‘С’
cyrillique est plutôt une ‘S’, enfin, se prononce quelque chose
ressemblant à /s/, je devrais dire l'‘С’ cyrillique : il va
falloir que j'interroge le Club Contexte en Сection Politique pour
fixer les détails.)
Bref, vous aurez compris l'idée : ce qu'est une lettre est quelque
chose d'assez délicat. Un matheux a envie de dire qu'une lettre est
une classe d'équivalence pour la relation d'équivalence être la
même lettre, mais qu'est-ce que c'est que cette relation
d'équivalence, justement ?
Unicode doit régulièrement prendre des
décisions to conflate or to disunify?, autrement
dit, décider si on doit considérer que deux machins sont ou non la
même lettre. Et cette décision n'a souvent rien d'évident, toutes
sortes de problèmes peuvent survenir dans les deux sens, et il n'y a
souvent pas de bonne solution. Notamment parce que la
relation être la même lettre a furieusement tendance à ne pas
être une relation d'équivalence : elle n'est pas transitive (une
langue pourrait considérer que foo et bar sont la même lettre, une
autre que bar et qux sont la même lettre, et une troisième que foo et
qux ne sont pas du tout la même lettre).
Voici quelques unes des choses, en vrac, que j'ai apprises en me
documentant à gauche et à droite sur Unicode et sur l'histoire des
formes d'écriture. On va voir que le Club Contexte aime beaucoup
s'amuser avec l'écriture. (Quasiment chaque paragraphe dans ce qui
suit raconte sa propre petite histoire et peut être lu indépendamment
des autres ; j'ai essayé de trouver un fil directeur, mais c'est trop
difficile, il n'y a juste aucune logique dans cette collection de
faits.)
Commençons par une question basique : faut-il considérer que la
première lettre des alphabets latin, grec et cyrillique, c'est-à-dire
‘A’, ‘Α’ et ‘А’ sont la même lettre ? Dans Unicode, ce
sont U+0041 LATIN CAPITAL LETTER
A, U+0391 GREEK CAPITAL LETTER
ALPHA et U+0410 CYRILLIC CAPITAL
LETTER A, c'est-à-dire qu'Unicode a tranché pour
désunifier.
D'un côté, considérer que non (comme le fait Unicode), i.e., que ce
sont trois lettres différentes, est très confusant pour les gens qui
ne voient aucune différence (notamment sur leur écran), cela peut être
la cause de toutes sortes de problèmes informatiques, notamment
d'attaques délibérées. (gооgle.com, par exemple, avec
deux U+043E CYRILLIC SMALL LETTER O,
a été acheté par Google pour ne pas qu'on puisse y rediriger
malicieusement les gens qui pensaient aller à google.com
— et de toute façon votre navigateur vous montrera probablement le
Punycode xn--ggle-55da.com si vous y allez — mais on ne
peut pas éliminer tous les risques de ce genre. Remarquez que
quasiment tous les langages de programmations acceptent, maintenant,
des identificateurs en Unicode, et j'attends le moment où quelqu'un
aura malicieusement introduit un trou de sécurité quelque part en
nommant une variable locale ‘а’ (U+0430
CYRILLIC SMALL LETTER A) pour cacher le fait qu'elle ne masque
pas, du coup, une variable ‘a’ (U+0061
LATIN SMALL LETTER A) de portée plus lointaine.) Ou à défaut
de bugs, simplement de petites tracasseries : si je veux vérifier que
je ne me suis pas trompé dans l'ordre de mes ‘A’, ‘Α’ et ‘А’, c'est
plus fastidieux que si je devais trier ‘A’, ‘B’ et ‘C’.
D'un autre côté, considérer que ‘A’, ‘Α’ et ‘А’ sont la même lettre
serait très gênant quand il s'agit de passer en minuscules, par
exemple (‘a’ et ‘α’ diffèrent certainement, et ‘а’ diffère peut-être
aussi), ou si on veut développer des polices spécifiques à l'un ou
l'autre des alphabets. (L'affichage du grec sur mon navigateur est
souvent rendu moche par le fait que j'ai des polices qui ont juste
le ‘π’, probablement parce qu'il sert plus souvent que d'autres, et
comme je ne sais pourquoi mon navigateur tend à préférer cette police,
je vois souvent cette seule lettre dans une police visiblement
différente. Imaginez à quel point la lecture du cyrillique serait
moche si les lettres communes à l'alphabet latin étaient prises dans
une police prévue pour l'alphabet latin et les autres dans une autre.)
Et je vais revenir plus bas sur la question de l'écriture cursive.
On n'a pas, quand on est locuteur natif d'une langue, une bonne
apréciation de la complexité de celle-ci : il est nécessaire pour se
rendre bien compte de certains phénomènes grammaticaux, de les
enseigner à un étranger, ou d'essayer de programmer un ordinateur, ou
de codifier très précisément ce que sont les règles. (Désolé pour
l'enfonçage de portes ouvertes en matière d'introduction.) J'ai
commencé à prendre conscience de la complexité du système de pronoms
français quand j'étais petit et que j'avais essayé de programmer (en
Turbo Pascal…) un petit générateur de phrases aléatoires — c'était
essentiellement un petit jeu oulipien, mais je voulais quand même
qu'il soit un minimum sophistiqué et qu'il reprenne correctement par
le bon pronom les personnes ou objets déjà évoqués. J'ai vite compris
mon malheur. Et plus tard, j'ai eu plusieurs occasions de découvrir
de nouvelles bizarreries que je n'avais pas encore remarquées.
Dans un certain nombre d'autres langues que je connais, les pronoms
ne sont pas trop compliqués : leur forme est définie par des
paramètres tels que la personne (1re, 2de, 3e) et/ou le type
(personnel, démonstratif, relatif, interrogatif…), le nombre
(singulier, pluriel, éventuellement duel), le genre (masculin,
féminin, neutre), et la fonction dans la phrase ou le cas
(sujet=nominatif, objet=accusatif, ce genre de choses). Il y a des
complications (par exemple des distinctions entre pronoms animés et
inanimés même pour un genre donné), mais globalement, ce modèle marche
pour plein de langues que je connais (ce qui est certainement un signe
que je connais très peu de langues), et certainement pour plein de
langues
du sprachbund
européen ou quelque chose comme ça.
Mais le français fait vraiment des bizarreries. Il suffit pour
s'en convaincre de regarder quelque chose d'aussi banal que moi, je
[fais quelque chose] : pourquoi diable est-ce que moi
et je, qui sont tous les deux des pronoms personnels de la
1re personne au singulier, diffèrent ainsi, alors qu'ils sont tous les
deux à ce qu'on appellerait classiquement un nominatif ? On peut
expliquer cette différence par le fait que je est un pronom
« clitique » ou « conjoint » ou « faible » tandis que moi est
un pronom « disjoint » ou « fort » : mais c'est une distinction qu'on
n'apprend pas à l'école ; le pronom clitique est forcément associé à
un verbe (on ne dit pas je tout court, même en réponse à une
question comme qui est là ?), et varie selon la fonction,
tandis que le pronom fort a une analyse syntaxique plus proche des
noms (par exemple ils peuvent prendre un adjectif : moi seul
alors qu'on ne dit jamais *je seul ; ils peuvent se
coordonner : toi et moi, pas *tu et je ; et ainsi de
suite).
Déjà, cette distinction entre pronoms clitiques et forts est
compliquée et bizarre, mais surtout, les règles présidant au choix de
l'une ou de l'autre forme (ou à la place des pronoms clitiques, qui
est très rigide : contraster tu me le présentes et tu le lui
présentes — le pronom indirect a changé de place), sont
invraisemblablement complexes et ne semblent exister que sous forme
d'un défilé interminable de cas et de sous-cas. On peut par exemple
consulter le Bon Usage de Grevisse (§660–674 au moins)
pour se rendre compte de la cascade d'exemples qui partent dans tous
les sens et qui échappent à tout semblant de logique. Bien sûr,
toutes les langues ont leurs exceptions bizarres aux règles, mais là,
je ne sais même pas quelles sont les règles qui permettraient
vaguement de mettre de l'ordre dans cette myriade de cas qui semblent
échapper à toute cohérence d'ensemble.
Je donne juste un exemple de subtilité qui m'avait particulièrement
frappé quand j'en ai pris conscience :
Je parle à ma mère → Je lui parle
J'obéis à mon chef → Je lui obéis
Je téléphone à mes amis → Je leur téléphone
J'annonce la nouvelle à mes proches → Je leur annonce la
nouvelle
Je donne des pièces à un mendiant → Je lui donne des
pièces
Je prends son sac à mon voisin → Je lui prends son
sac
Mais :
Je pense à ma mère → Je pense à elle (et pas *Je
lui pense)
Je songe à mes enfants → Je songe à eux (et pas
*Je leur songe)
Je renonce à mes amis → Je renonce à eux (et pas
*Je leur renonce)
Je m'adresse à mon compagnon → Je m'adresse à lui
(et pas *Je me lui adresse)
Je m'en remets aux dieux → Je m'en remets à eux (et
pas *Je me leur en remets(?))
Je prends garde à mon ennemi → Je prends garde à lui
(et pas *Je lui prends garde(?))
Manifestement il y a des verbes à construction indirecte avec la
préposition à qui admettent le pronom clitique indirect (la
première série d'exemples) et d'autres qui ne l'admettent pas
(Grevisse §662(b)3º). Pourquoi tant de haine ? Et ce n'est
même pas aussi simple que le choix du verbe : la comparaison
entre je lui prends son sac et je prends garde à lui
montre que le verbe prendre accepte le pronom clitique indirect
(comme, de façon générale, les verbes construits avec un « complément
d'objet second ») mais plus quand il fait partie de la locution
verbale prendre garde (qui a été lexicalisée). Aussi, la
présence d'un pronom clitique objet
direct sauf le, la ou les interdit la
présence du pronom clitique objet indirect (Grevisse §662(b)2º) : on
dit je te le présente (le est objet direct, te
est objet indirect) mais je me présente à toi, pas *je te me
présente (il est vrai que, dans l'autre sens, je le présente à
toi ne choque en rien). Et ce n'est là qu'un minuscule fragment
des nombreuses difficultés liées à ce choix de pronoms.
Autre bizarrerie que je trouve frappante : l'impératif à la
forme positive (non-négative) impose une postposition du pronom
objet : ne le regarde pas devient regarde-le ; et cette
postposition demande un pronom fort pour la 1re et 2de personne du
singulier (Grevisse §661(c), voir aussi §683) : donc ne me
regarde pas devient regarde-moi. Quelle combinaison
bizarre de conditions ! En fait, l'impératif positif a ses règles
tellement spécifiques et incompréhensibles que le français ne sait pas
vraiment retirer la négation de ne m'en donne pas ou ne m'y
mène pas : est-ce donne-m'en ou donne-moi[s???]-en
ou donnes-en-moi ? mène-m'y ou mène-moi[s???]-y
ou mènes-y-moi ? Je pourrais dire que je ne sais pas, mais en
fait, personne ne sait. (Les espèces-de-pronoms en et y
sont des horreurs particulièrement absconses de la grammaire
française, et je renonce à y comprendre quoi que ce soit.
Par ailleurs, il faudrait faire une note sur cette bizarrerie des
impératifs qui prennent une ‘s’ inopinée quand ils sont suivis d'un de
ces pronoms, comme si c'était le but de faire croire que va
prend une ‘s’ vu qu'on dit vas-yparce que ce serait
vraiment trop simple sinon, hein.)
Et il n'y a pas que les pronoms personnels avec leur distinction
byzantine entre clitiques et forts qui posent problème. Considérons
les interrogatifs et les relatifs : la distinction entre qui
et que est une distinction sujet/objet s'agissant des relatifs
(bon, j'ai déjà écrit un roman sur
les relatives, je ne recommence pas) ; mais tout d'un coup, lorsqu'ils
sont interrogatifs, c'est une distinction entre personne et
non-personne(?). Et donc dans une tournure (fréquente) telle
que qui est-ce qui t'a touché ?, le premier qui, qui est
interrogatif, fonctionne selon la distinction personne/non-personne
(comparer qui est-ce qui t'a touché ? et qu'est-ce qui t'a
touché ?) tandis que le second qui, qui est relatif,
fonctionne selon la distinction sujet/objet (comparer qui est-ce
qui t'a touché ? et qui est-ce que tu as touché ?). Mais
le plus amusant dans l'histoire, c'est qu'il manque plus ou moins un
pronom interrogatif sujet non-personne :
Qui est-ce que tu vois ? → Qui vois-tu ? [personne
objet]
Qu'est-ce que tu vois ? → Que vois-tu ?
[non-personne objet]
Qui est-ce qui t'a touché ? → Qui t'a touché ?
[personne sujet]
Qu'est-ce qui t'a touché ? → ??? [non-personne sujet]
Théoriquement on peut dire quoi t'a touché ? ou même que
t'a touché ?, mais les deux sonnent vraiment très bizarre.
Qu'est-ce que c'est que cette langue pourrie qui n'a même pas un
pronom interrogatif sujet pour les choses ?
Bien sûr, Grevisse (§731(a)) a toutes sortes
d'exemples d'écrivains qui peinent à s'en sortir avec quoi
et que et de tournures qui sonnent quand même marcher :
• Avec quoi : Quoi de neuf ? — Quoi donc
t'étonne ? [Flaubert, Madame Bovary] — Mais quoi
donc, alors, ou qui donc [...] secouera assez cette nation [...] ?
[Montherlant] — Quoi, dans la vie, lui donnait le droit de parler
ainsi ? [Daniel-Rops] — Qui ou quoi vous a donné cette
idée ? — Car quoi résiste au regard humain [...] ?
[Claudel] — Mais, à la fin, quoi vous autorise à croire...
[Crommelynck] • Avec que (très rare hors expressions
figées) : Qu'est-ce ? [Rostand, Cyrano II, 3]
— Que me vaut tant d'honneur ? — Qu'avait bien pu pousser
papa à quitter brusquement sa tribu [...] ? [Ragon]
Franchement, je ne voudrais pas enseigner le français. On peut
toujours essayer de répéter le mantra contentez-vous d'écouter, ça
viendra tout seul, mais j'ai de sérieux doutes. Et l'ironie est
que les Français sont souvent persuadés que l'allemand est une langue
très compliquée parce qu'il y a des déclinaisons et tout et tout : je
crois bien que, si j'étais chinois, je préférerais mille fois
apprendre le système de déclinaisons et de pronoms de l'allemand que
les zillions de cas du système de pronoms français ! (Trouvez-moi un
Chinois qui a appris à la fois l'allemand et le français, si possible
simultanément et à un rythme comparable, jusqu'à les parler
couramment, pour confirmer ou infirmer ma conjecture.)
Ce que je vais raconter ici n'a rien d'original, n'importe quelle
personne ayant un peu réfléchi à la grammaire française l'aura
certainement remarqué, mais je me suis récemment rendu compte que le
phénomène était encore plus marqué que je le pensais, donc je vais
expliciter de quoi il est question :
Il existe en français une construction aller+infinitif :
mais en fait, et c'est ça que je veux souligner, il n'y en a pas juste
une, il y en a deux bien distinctes. À savoir : (A) la
construction du verbe aller avec un infinitif qui marque la
finalité du déplacement, et (B) une construction spéciale, qui est
syntaxiquement identique, et qui sert à former le futur proche. Tout
ça est bien connu, et il est par ailleurs évident que (B) provient
d'un glissement de sens de (A), mais ce sur quoi j'attire l'attention
et qui n'était pas complètement clair pour moi, c'est que ces
constructions sont vraiment séparées, c'est-à-dire qu'il n'y a pas un
continuum de sens entre les deux mais bien deux possibilités
distinctes, parfois seule l'analyse (A) est possible, parfois seule
la (B) l'est, et parfois les deux le sont mais avec des sens qui ne se
recouvrent pas.
La construction (A), c'est quelque chose comme j'ai trop attendu,
j'ai faim, maintenant je vais manger : il faut comprendre je
vais manger comme je vais à la cantine, l'indication d'un
déplacement qui a pour but d'accomplir l'action indiquée par
l'infinitif ou comme destination l'endroit où cette action sera
accomplie.
La construction (B), c'est quelque chose comme pour l'instant
j'attends d'avoir faim, je vais manger vers 14h : il faut
comprendre je vais manger comme je mangerai, un simple
futur (qui se distingue du futur simple par la proximité temporelle ou
simplement par le registre de langue un peu plus informel),
éventuellement comme je suis sur le point de manger.
La principale raison pour laquelle je pense que ces constructions
sont bien distinctes, c'est que :
La construction (B) n'est possible qu'aux présent et imparfait du
mode indicatif, tandis que la construction (A) n'a pas de restriction
particulière. Ainsi, va manger [impératif] ou tu iras
manger à quelle heure demain ? [futur] sont forcément des
constructions (A). Le fait de préciser un mode de transport ou un
lieu peut aussi forcer l'interprétation comme la
construction (A) : je vais chercher les enfants en voiture
ou …à l'école (on peut mettre ce complément juste après le
verbe aller pour que ce soit parfaitement clair que c'est le
verbe en question qui est ainsi complété).
La construction (A), elle, est parfois impossible pour des raisons
de sens, alors que la construction (B) peut s'appliquer à n'importe
quel verbe. Je crois que l'exemple le plus convaincant dans ce sens
est quand le verbe à l'infinitif est lui-même le
verbe aller : si je dis je vais aller chez le médecin,
il s'agit forcément de la construction (B) (ça n'a pas de sens de se
déplacer pour se déplacer…). Le fait d'avoir un complément de lieu
comme ici peut aussi rendre impossible la construction (A) (on
ne peut pas aller ici, seulement venir ici) : je vais manger
ici ne peut être qu'un futur proche (et cette fois, on ne peut pas
mettre l'adverbe en question juste après le verbe aller, il ne peut se
rapporter qu'à manger).
Pour rendre ces impossibilités plus frappantes, on peut essayer de
construire une phrase, de syntaxe apparemment raisonnable, où on
combine l'impossibilité de (A) et l'impossibilité de (B) : par
exemple il ira aller chez le médecin — ça choque, parce que le
futur interdit l'analyse comme (B) tandis que le double verbe aller
n'a pas de sens comme construction (A) ; idem pour va manger
ici.
Le résultat, c'est qu'une phrase comme je vais faire des
courses, où les deux constructions sont possibles, a deux sens
bien distincts : dans le sens (A), j'indique que je suis en chemin
vers un commerce (je sors de chez moi, je vais faire des courses,
et je tombe nez à nez avec Madame Michu), tandis que dans le
sens (B) j'indique que la transaction aura lieu dans l'avenir (cet
après-midi je vais faire des courses puis [je vais] rester ici toute
la soirée).
J'avais déjà fait des remarques dans ce sens
dans cette entrée passée, mais sans
complètement saisir la double construction. Pourtant, quelqu'un
m'avait signalé en commentaire un malentendu survenu en italien parce
que cette langue n'a pas le calque de la construction (B) du français
(et que si on l'utilise, cela se comprendra donc comme une
construction (A), dont le sens est proche mais suffisamment différent
pour pouvoir causer une confusion).
J'avais toutefois déjà signalé l'argument essentiel selon lequel la
construction (B) n'est possible qu'à un nombre limité de temps. Ce
fait peut servir à distinguer les constructions (A) et (B) en mettant
la phrase au futur (ou à l'impératif ou quelque chose comme ça) ; par
exemple, on peut mettre au futur je sors de chez moi, je vais faire
des courses, et je tombe nez à nez avec Madame Michu comme je
sortirai de chez moi, j'irai faire des courses, et je tomberai nez à
nez avec Madame Michu et on peut le mettre à l'impératif
comme sors de chez toi, va faire des courses, et tombe nez à nez
avec Madame Michu ; en revanche, si on veut mettre au futur ou à
l'impératif cet après-midi je vais faire des courses puis [je vais]
rester ici toute la soirée, on sent bien que la seconde partie
pose problème et que la première change subtilement de sens. (Du
coup, c'est amusant, cet après-midi je vais faire des courses
est plutôt une construction (B) tandis que cet après-midi j'irai
faire des courses est forcément une construction (A)… qui a
essentiellement le même sens.)
Maintenant, si on cherche à généraliser la construction (B), il y a
d'autres verbes que aller qui régissent des constructions
semblables. Classiquement, on signale venir de qui marque le
passé proche (je viens de rentrer), mais là il n'y a pas
vraiment de construction (A) correspondante (ou s'il y en a une, je ne
l'utilise pas vraiment : éventuellement avec le verbe revenir
ce serait plus plausible). Mais je suis tenté d'analyser
aussi compter+infinitif comme analogue
de aller+infinitif : je compte lui parler a pris un sens
très particulier, qui ne s'analyse pas vraiment comme la somme de ses
parties, et, comme la construction (B) du futur proche introduit par
le verbe aller, j'ai du mal à la mettre à un autre temps ou
mode que les présent et imparfait de l'indicatif (je comptais lui
parler passe, mais je compterai lui parler ou compte lui
parler me semblent vraiment bizarres). L'ennui, c'est qu'une fois
qu'on commence à trouver des constructions figées dans tous les sens,
on va en trouver un peu trop.
Je crois que le terme approprié pour l'évolution historique de la
construction (A) vers la construction (B)
est grammaticalisation,
mais ce qui est intéressant est bien la coexistence distincte (et pas
dans un spectre sémantique de nuances entre les deux) entre la version
non-grammaticalisée (A) et la version grammaticalisée (B).
(Mais bon, je suis un linguiste du dimanche, peut-être qu'on va
trouver que je raconte des bêtises.)
De la fascination des Français pour le prescriptivisme linguistique
Méta : L'entrée qui suit a été essentiellement
écrite en février 2016, laissée en plan et jamais finie ; j'essaie de
me forcer un peu à publier des entrées qui, comme ça, moisissent dans
mes cartons. Comme je n'ai pas envie de la reprendre complètement (ce
qui serait la garantie que je ne la publierais jamais), je laisse
telles quelles certaines choses écrites en 2016 (et qui font donc
référence à événements d'alors comme récents) et j'en modifie
d'autres ; je n'ai pas non plus envie d'éclaircir systématiquement ce
qui a été écrit quand, donc on me pardonnera un certain flou temporel
dans ce qui suit. De même que je dois demander pardon pour le
caractère un peu désordonné de ce texte (surtout sa fin), puisque je
ne savais plus vraiment où je voulais en venir et j'ai complété comme
j'ai pu.
Ajout :ce
fil Twitter exprime grosso modo les mêmes idées que le très long
billet ci-dessous mais de façon probablement plus claire et
certainement plus digeste (ou en tout cas, il résume ma propose
position vis-à-vis des règles linguistiques).
⁂
Dans une entrée récente [récente
en février 2016, donc…] j'avais choisi d'entrer en matière en
défendant, de façon un peu provocatrice, une phrase écrite dans
l'entrée précédente (…dans le
cadre d'un cours # j'enseigne à un groupe de ce cours [les
cours de notre école sont divisés en groupes d'élèves, parfois
spécifiques à un cours, donc il s'agit bien d'un groupe de ce cours]
→ …dans le cadre d'un cours dont j'enseigne à un groupe). Il
s'agissait d'un prétexte pour entrer en matière et réfléchir aux
différentes subtilités dont les grammaires ne parlent essentiellement
jamais concernant les subordonnées relatives. Mais aussi d'une façon
de troller les prescriptivistes linguistiques que je sais très
nombreux parmi les Français. Et de fait, la petite provocation a
marché encore mieux que ce que j'avais imaginé, puisque les
commentaires, très nombreux, ont presque totalement ignoré le corps de
ce que j'avais écrit sur les relatives (ou, pire, ont cru ou fait
semblant de croire que tout tournait autour de la phrase douteuse ou
cherchait à la justifier), et se sont focalisés sur le caractère
grammatical ou non de la phrase de l'entrée précédente ou sur les
autres reproches qu'on peut lui faire. (Il s'est ainsi agi de savoir
si un cours peut être divisé en groupes, si on peut enseigner à des
élèves ou si on doit enseigner des élèves, s'il est correct
d'écrire une page d'un livre avec deux articles indéfinis,
etc.) Je ne peux pas vraiment m'en plaindre : qui sème le troll
récolte la chienlit. (Et il me faut avouer que la discussion sur les
interactions entre l'article indéfini et les compléments du nom
n'était pas dénuée d'intérêt.)
Mais très peu de temps après, la sphère
politico-médiatico-blablatique nationale a été prise d'une agitation
analogue. À part qu'elle orbite à un niveau nettement inférieur aux
commentaires de mon blog , ladite sphère a surtout
prouvé la fascination elle-même fascinante qu'ont les Français pour le
prescriptivisme. Ne serait-ce que dans le résumé, par ailleurs
totalement erroné, que j'ai vu passer du point de départ de
cette phrénésie : L'Académie a décidé de supprimer les
accents circonflexes.There are so many things
wrong with this, I don't know where to start.
J'ai déjà dû raconter que je suis avec la phonétique un peu dans la
situation de Donald Knuth qui racontait quelque part qu'une fois qu'il
a commencé à s'intéresser à la typographie,
I can't go to a restaurant and order food because I keep looking at
the fonts on the menu.
Il y a plein de gens dont je
n'arrive pas à écouter ce qu'ils disent tellement je suis occupé à
écouter la manière dont ils prononcent. Je m'en plaignais par
exemple ici à propos de Nicola
Sturgeon, qui est à la tête du gouvernement dévolu d'Écosse. (Soit
dit en passant, la phrase précédente contient une périphrase tordue
parce que je n'arrive toujours pas à me décider entre la Première
ministre, la Premier ministre, ou le Premier
ministre.)
Voilà qu'il m'arrive la même chose avec Theresa May : en
écoutant cette
interview
et cette
allocution, je remarque qu'elle prononce /nɪˈgəʊsieɪt/
pour negotiate et /ˈkwestjən/
pour question (ce que je souligne est le phonème
/s/ plutôt que /ʃ/, autrement dit, le son de sin
et pas de shin), mais elle prononce /ˈɪʃuː/
pour issue. Toutes ces prononciations sont
possibles (chez les Américains, /ˈɪʃuː/ est presque universel, et même
chez les Anglais, il doit être majoritaire), mais compte tenu des deux
mots que je viens de mentionner, je pensais qu'elle dirait /ˈɪsjuː/ :
la combinaison m'étonne par son manque de cohérence, à tel point que
j'en viens à me demander si elle ne force pas exprès son accent dans
un sens ou dans l'autre.
De même, quand elle dit it's either going to be
me, or Jeremy Corbyn, et pas it's either going to
be I, je me demande dans quelle mesure c'est spontané ou si elle
ne veut pas paraître trop posh.
Sur les adjectifs qui élargissent le nom qu'ils qualifient
Le point de grammaire(?) que je veux évoquer ici concerne surtout
la terminologie scientifique, notamment mathématique, même s'il
est a priori complètement général.
Normalement, quand on accole une épithète à un nom, ou en fait
n'importe quelle sorte de complément, le sens devrait être
de préciser, c'est-à-dire de restreindre, l'ensemble
des entités possiblement désignées. Par exemple, même si vous ne savez
pas ce que c'est qu'un foobar (c'est normal !), ni ce que signifie
l'adjectif cromulent (idem), si je parle d'un foobar
cromulent, vous pouvez conclure qu'il s'agit d'une sorte
particulière de foobar, qui a une propriété additionnelle (être
cromulent) par rapport à celle d'être un foobar. De même,
un bazqux roncible frobnicable devrait être un type spécial de
bazqux roncible, qui est lui-même une sorte de bazqux ; et le groupe
des ptérodoncles mouffetés de Linné devrait être un ensemble
(d'animaux ?) plus restreint que celui des ptérodoncles.
Je suis sûr que les grammairiens ou les linguistes ont un terme
précis pour ce phénomène, mais je ne le connais pas ; ou peut-être, au
contraire, un terme pour les exceptions. Car il y a bien sûr des
exceptions. Dans le langage courant, elles abondent. Un secrétaire
général n'est pas vraiment un secrétaire (et pas du tout un général,
mais ça c'est plutôt une blague). Un procureur adjoint n'est pas un
procureur, puisqu'il n'est qu'adjoint (et il en va de même d'adjectifs
comme délégué). Un faux bourdon n'est évidemment pas un
bourdon, comme un faux acacia n'est pas un acacia : on peut s'attendre
à ce qu'un faux foobar ne soit pas un foobar, d'un autre côté,
une fausse bonne idée est quand même une idée, même si elle
n'est pas une bonne idée. Il y a aussi tout ce qui est nommé
par métonymie ou par métaphore : un blouson noir n'est pas une
sorte de blouson et un visage pâle n'est pas une sorte de
visage ; une peau de chagrin était bien ce que ça dit jusqu'à
ce qu'un roman de Balzac donne un sens très particulier à cette
expression. Et ainsi de suite. Évidemment, les frontières des mots
dans le langage non-technique ne sont pas rigoureusement définies,
donc il n'est pas toujours possible de décider avec certitude si un
adjectif est ou n'est pas restrictif au sens du paragraphe précédent :
un tableau noir est-il un type particulier de tableau, par exemple ?
certainement si on prend tableau au sens le plus large, mais ce
n'est pas ce qu'on entend normalement par ce mot. Un hôtel
de ville est un hôtel pour une certaine définition
d'hôtel, mais ce n'est plus vraiment le sens courant de ce mot.
Et je ne saurais pas vraiment dire si un coup de soleil est une sorte
de coup, ou si le clair de lune est une sorte de clair
(whatever that may be).
Dans le vocabulaire technique, on pourrait espérer que les mots
aient un sens suffisamment précis pour pouvoir éviter ces gags, mais
ce n'est pas le cas. En mathématiques, un faisceau pervers
n'est pas un faisceau et en physique, un champ quantique n'est
pas un type particulier de champ [classique] mais un concept parallèle
dans un cadre adjacent (la théorie quantique des champs), et il est
discutable qu'une étoile à neutrons soit une étoile. Sans
compter, bien sûr, les cas où le terme technique est une locution
indivisible : un trou noir (terme technique) n'est pas une
sorte particulière de trou (terme non technique). La situation reste
beaucoup plus rare que dans le langage courant.
Il y a cependant une situation importante où un foobar cromulent
n'est pas une sorte particulière de foobar, et dont les matheux ont
assez souvent besoin, et peut-être aussi d'autres sciences (les
exemples ne me viennent pas trop à l'esprit, mais je suppose qu'ils
doivent exister), ce sont les cas où on veut au
contraire élargir le sens d'un mot. Autant la situation
normale est que l'adjectif restreint le sens d'un mot, et les
diverses situations évoquées jusqu'ici sont des cas où il déplace
(comme faux, adjoint, etc.) ou bien le transforme de
façon complètement imprévisible et figée par l'usage (blouson
noir), la situation d'élargissement est encore un peu
autre chose.
Le cas d'usage typique pour les maths est qu'un foobar est défini
par différentes propriétés, et on veut désigner un objet qui vérifie
toutes les propriétés du foobar sauf une. On peut bien sûr appeler ça
un quasi-foobar ou un pseudo-foobar ou un presque
foobar (near foobar en anglais ; certains
grammairiens grincheux pourraient râler de voir un adverbe
— presque — qualifier un nom), ou ce genre de choses, mais on
aura peut-être envie de parler de foobar généralisé, et là,
l'adjectif généralisé élargit le sens du mot.
Mais je pense que la situation la plus fréquente est celle, très
proche, où on fait tout un traité sur les foobars bleutés, alors par
flemme d'écrire bleuté à chaque fois, on convient dans
l'en-tête du traité : le terme foobar désignera ci-après,
sauf précision du contraire, un foobar bleuté. Une fois cette
convention faite, pour parler d'un foobar en général, on doit
écrire foobar non nécessairement bleuté, et non
nécessairement bleuté est une locution adjectivale qui a cette
propriété d'élargir le sens du mot foobar (en retirant
la restriction bleuté). Et comme le mot nécessairement
est lui-même long à dire, on écrit le plus souvent foobar non
bleuté, ce qui est un abus de langage ou de logique parce qu'on
veut, en fait, dire non nécessairement bleuté (i.e., foobar
dans le sens où on retire la convention faite initialement qu'il est
sous-entendu bleuté, mais il se pourrait qu'il soit quand même bleuté
quand même). Il faut admettre que cela cause une certaine confusion,
mais je ne connais aucune façon agréable de se sortir de ce problème
de rédaction.
Le cas d'école est celui de la commutativité (et éventuellement de
l'unitarité ou de l'associativité) des anneaux : en algèbre, un anneau
est défini comme un ensemble muni d'opérations (l'addition et la
multiplication) vérifiant un certain nombre de propriétés
(l'associativité de l'addition, la commutativité de celle-ci,
l'existence d'un neutre et de symétriques pour l'addition, la
distributivité de la multiplication sur l'addition, l'associativité de
la multiplication et l'existence d'un neutre pour la multiplication ;
la dernière, voire les deux dernières n'étant pas systématiquement
incluses dans la définition) ; et les gens qui font de
l'algèbre commutative vont avoir envie d'ajouter une
propriété supplémentaire, la commutativité de la multiplication, ce qui donne
la notion d'anneau commutatif (commutatif étant ici un adjectif
régulier, c'est-à-dire restrictif). C'est pénible d'écrire anneau
commutatif trente-six fois par page, alors on fait souvent la
convention que anneau signifiera désormais anneau
commutatif (typiquement sous la forme : tous les anneaux
considérés ici seront, sauf précision du contraire, supposés
commutatifs, et peut-être, pour qu'il n'y ait aucun doute sur la
définition utilisée, unitaires [i.e., possédant un élément neutre
pour la multiplication] et associatifs). Mais on a quand même
envie de temps en temps de dire quelque chose sur les anneaux plus
généraux, alors on devrait écrire anneau non nécessairement
commutatif en utilisant un adjectif qui élargit le sens du mot.
Sauf qu'en fait, il n'est quasiment jamais intéressant de parler
spécifiquement d'anneaux non nécessairement commutatifs qui ne
sont effectivement pas commutatifs (au sens où il existe
vraiment x et y tels
que x·y≠y·x), donc on dit
simplement non commutatif pour non nécessairement
commutatif ; ce qui conduit à la situation absurde qu'un anneau
commutatif est un cas particulier d'un anneau non commutatif (puisque
ce dernier terme signifie en fait non nécessairement
commutatif). C'est agaçant, j'en conviens, mais je ne connais pas de
façon agréable de s'en sortir.
En fait, c'est très souvent le cas avec les adjectifs en non
en mathématiques : de la même manière, un automate fini déterministe
est un cas particulier d'un automate fini non déterministe (puisque ce
dernier terme signifie en fait non nécessairement
déterministe).
Le terme d'algèbre est particulièrement merdique parce qu'il
signifie plein de choses selon le contexte : la multiplication peut
être commutative et associative, ou seulement associative, ou même
pas ; si on la suppose associative par défaut (ce qui est quand même
le plus courant), ça n'empêchera pas d'écrire algèbre de Lie
alors que le crochet de Lie n'est pas associatif (on a une autre
hypothèse à la place, l'identité de Jacobi) ; de même, si on
écrit algèbre alternative, il faut comprendre que l'hypothèse
d'associativité a été remplacée par quelque chose de plus
faible (l'hypothèse d'alternativité / de Moufang) ; et c'est pareil
pour les algèbres de Jordan. Donc une algèbre de Lie, une algèbre
alternative et une algèbre de Jordan ne sont (en général) pas des
algèbres [associatives], ce sont des algèbres non [nécessairement]
associatives, en revanche toute algèbre [associative] est une algèbre
alternative. Et c'est sans compter la notion très générale d'algèbre
sur une monade ! Pour le mathématicien habitué, tout ça ne pose pas
trop de problème, à part un énervement certain quand on tient à la
logique, mais quand il s'agit d'enseigner, c'est vraiment
embêtant.
Certains proposent parfois des adjectifs différents pour rendre la
terminologie moins incohérente : par exemple, si on convient qu'un
corps est nécessairement commutatif (ce qui, n'en déplaise à Bourbaki,
est quasiment universellement admis), lorsqu'on veut parler de corps
non nécessairement commutatif, plutôt que d'écrire la longue
expression corps non nécessairement commutatif ou l'abus de
langage corps non commutatif, certains aiment écrire algèbre
à division (avantage : c'est bien une algèbre ; inconvénient :
personne ne sait au juste ce que c'est qu'une algèbre), ou corps
gauche (avantage : c'est relativement court et agréable à écrire ;
mais il reste que ce n'est pas un corps, et le terme n'est pas ultra
standard), voire corps-gauche (le trait d'union permet de faire
comme si ce n'était pas un adjectif et de prétendre qu'il est
complètement normal qu'un corps-gauche ne soit pas un corps). Ça peut
marcher pour des cas précis, mais ce n'est pas une solution
universelle.
On pourrait aussi se demander ce qu'un adverbe est censé avoir
comme effet général sur un adjectif (qui lui-même qualifie un nom) :
si les foobars orgnesquement cromulents sont censés être des
foobars, comment se situent-ils par rapport aux foobars cromulents ?
Je ne crois pas vraiment qu'il y ait de convention absolue en
mathématiques : parfois localement cromulent
implique cromulent, parfois c'est la réciproque qui vaut,
parfois ni l'un ni l'autre.
Comment faut-il transcrire et prononcer la lettre ج en arabe ?
Je recopie/complète/paraphrase ici ce que j'ai
écrit sur un forum de discussion ailleurs.
Pour une raison bien mystérieuse, beaucoup de gens se mettent à
parler, en français et en anglais, de mots dérivés de
l'arabe جِهَاد
(ǧihād), signifiant quelque chose comme effort. La
première lettre de ce mot est ‘ج’ (ǧīm, en Unicode U+062C ARABIC
LETTER JEEM), et le mot est généralement rendu en anglais
comme jihad, et en français comme jihad
ou djihad. Pourquoi ce ‘d’ initial, et comment faut-il
transcrire cette lettre ou ce mot ?
Pour ce qui est de la translitération, différents standard
existent. Si on
regarde ce
tableau récapitulatif
(globalement, ce site est
très précieux pour comparer les translitérations de toutes sortes de
langues), on voit que le ‘ج’ est rendu comme : ‘ǧ’
en DIN-31635
et ISO-233,
‘j’ dans la transcription des Nations-Unies et celle de la
Bibliothèque du Congrès, et ‘dj’ dans celle de
l'Encyclopædia
of Islam (deuxième édition).
Différentes prononciations existent aussi. (Pour ceux qui ne
connaissent pas l'alphabet phonétique, ce que je note [ʒ] dans ce qui
suit est le son de la consonnne du mot français jeu, tandis que
[dʒ] est ce qu'on entend avant et après la voyelle dans
l'anglais judge, et [g] est la consonne du mot
français ou anglais gay.) Globalement, de ce que je comprends,
et peut-être de manière simplifiée, le ‘ج’ arabe est prononcé [dʒ] en
Arabie, [ʒ] en Syrie et Jordanie, et aussi au Maroc, [g] en Égypte
(cf. le nom du
cryptosystème ElGamal,
pour الجمل (al-ǧamal), le nom du monsieur qui l'a
inventé, litéralement le chameau). Plusieurs
prononciations existent en Algérie (peut-être bien les trois), et en
plus, ça dépendra du type d'arabe (classique ou dialectal, mais la
prononciation de l'un peut déteindre sur l'autre) et peut-être du
registre de langue. L'Assimil
arabe (qui prétend enseigner
l'arabe
standard moderne) prononce [ʒ].
Historiquement (à l'époque coranique et classique), il semble que
c'était un [ɟ], c'est-à-dire
une occlusive
palatale voisée, un son pas super facile à expliquer (il y a un
enregistrement sur l'article Wikipédia que je viens de lier), qui est
susceptible de pas mal de variabilité, et que des gens peuvent
entendre de différentes manières, mais en gros c'est le ‘gy’ du
hongrois. Il n'est pas très surprenant que ce son ait pu glisser soit
vers [dʒ], soit vers [ʒ], soit vers [g], ou les trois à la fois. De
façon encore plus ancienne (en proto-sémitique), c'était probablement,
et logiquement, un [g].
Je ne sais pas
comment le
calife autoproclamé prononce quand il lit le Coran. Je n'ai pas
essayé de lui écrire pour lui demander, mais je soupçonne que ce
serait une Mauvaise Idée®.
Mais alors, que vaut-il mieux faire quand on importe un mot arabe
en français ?
Pour ce qui est d'une translitération fidèle (j'ai
déjà écrit ce que je pensais en général
ici), je trouve qu'ISO-233-2 (utilisée par
la BNF
et documentée
ici) est la meilleure, et la lettre est alors notée ‘ǧ’, donc par
exemple, ǧihād. Cette transcription ‘ǧ’ a l'avantage de rendre
assez bien compte à la fois de la multiplicité des prononciations et
de l'historique de la lettre. (Elle a, en revanche, l'inconvénient de
se confondre facilement avec le ‘ğ’ du turc, qui n'a rien à voir et se
prononce en allongeant la voyelle qui précède, comme dans le nom du
président-bientôt-à-vie de la Turquie, Erdoğan. Si vous avez du mal à
voir la différence, sur le ‘ǧ’ de la transcription arabe il y a
une sorte de petit
‘v’ tandis que sur le ‘ğ’ turc il y a
une sorte de petit
‘u’)
Quand on ne peut pas transcrire ‘ǧ’, et il faut admettre que ce
n'est pas forcément évident à taper ou à typographier (notamment dans
les provinces reculées où la lumière bienfaisante d'Unicode n'Éclaire
pas encore le monde), je trouve que ‘j’ est un succédané acceptable.
Il est utilisé par des standards respectables, il ne prête pas à
confusion, et il permet assez bien d'imaginer que les deux
prononciations [dʒ] et [ʒ] existent. Il y a bien des langues où on
transcrit ‘j’, y compris en français, le son [dʒ] : le
japonais[#], par exemple. De
même, si on ne peut pas noter ‘ā’, taper ‘â’ est un remplacement
raisonnable, et on peut donc écrire jihâd. • À la limite, on
pourrait aussi transcrire ‘g’ sans diacritique, comme c'est déjà fait
dans différents cas, comme Alger
pour الجزائر. • En revanche, ‘dj’ est
complètement merdique comme transcription, notamment parce qu'il
s'agit d'une unique consonne en arabe alors que la combinaison dāl+ǧīm
est possible (au moins en théorie ; je ne sais pas si elle se produit
effectivement sans voyelle[#2]),
et aussi parce que ça interdit qu'on puisse imaginer plusieurs
prononciations.
[#] Et je ne vois pas
des gens proposer d'écrire djudo (ou djoudo) pour éviter
que les français prononcent [ʒydo] l'art martial 柔道
que, pour une fois, ce sont les anglophones qui prononcent de façon plus
proche de l'original.
[#2] C'est très
difficile à trouver, faute de dictionnaire arabe en ligne qui ne soit
pas merdique. Je crois que le verbe de
radical د-ج-ل (d-ǧ-l),
soit دَجَلَ (daǧala), mentir (enfin, il a
menti), donne à l'inaccompli يَدْجُلُ
(yadǧulu), il ment. Mais il semble que ce verbe sert surtout
sous sa forme dérivée II دَجَّلَ (daǧǧala, de même
sens), qui elle doit donner يُدَجَّلُ (yudaǧǧalu),
donc sans la combinaison dǧ que je cherche. Sinon, mon
Bescherelle des verbes arabe liste un
radical د-ج-و (d-ǧ-w),
soit دَجَا (daǧā), qui donnerait à
l'inaccompli يَدْجُو (yadǧū), mais ils n'en donnent
pas le sens et je ne l'ai trouvé dans aucun dictionnaire, donc je ne
sais pas si c'est une invention. (On devinera au passage que la
grammaire arabe m'a
inspiré ici.)
Je suppose que la transcription ‘j’ a été surtout introduite par
des anglophones, qui préfèrent logiquement la lire [dʒ] d'autant que
le [ʒ] seul est rare en anglais (et n'a pas vraiment d'orthographe
standard : on le trouve orthographié ‘s’
dans pleasure et
dans vision, mais ‘z’
dans azure). Je me demande si les français ne
sont pas tentés demettre un ‘d’ devant juste pour reproduire la
prononciation anglaise (qui, comme je l'ai expliqué,
est valable, mais en aucun cas la seule possible).
J'ai remarqué en tout cas que c'est ce qui s'est passé s'agissant
de la lettre persane ژ (U+0698 ARABIC LETTER JEH), transcrite ‘ž’ dans
les bonnes transcriptions, qu'on trouve par exemple dans le nom du
président Aḥmadīnežād
[je ne suis pas sûr de la transcription DIN-31635,
qui serait sans doute la meilleure parce
que ISO-233-3 a l'air cassé]. Cette lettre persane
se prononce [ʒ], et les anglais arrivent quand même à la transformer
en [dʒ] parce qu'ils n'ont pas l'habitude du [ʒ], du coup on trouve ce
nom transcrit Ahmadinejad et prononcé avec [dʒ], y compris par des
francophones qui reprennent ainsi la bizarrerie des anglophones (alors
qu'en français, même si on transcrit « Ahmadinejad », il n'y a pas de
raison de lire [dʒ]). Même si en arabe ce n'est pas aussi critiquable
puisque le ǧīm peut effectivement se dire [dʒ], je soupçonne quand
même que le même mécanisme a pu jouer.
Pour la prononciation en français comme pour l'orthographe, le
français est de toute façon incohérent dans sa façon de rendre les
mots arabes. Mais on dit algèbre
pas aldjèbre, Alger pas Aldjer, une orange
pas une orandje, un tajine pas un tadjine,
et l'hégire pas l'hédjire, donc à chaque fois [ʒ] et pas
[dʒ]. À cause de tous ces exemples, je trouve plus raisonnable de
s'en tenir à [ʒ], même s'il est vrai que pour un ǧinn (jinn ? djinn ?)
cela va à l'encontre de l'habitude. (Apparemment, c'est Victor Hugo
qui a popularisé ce mot, au moins en France, à travers
son célèbre
poème : a-t-il été peut-être influencé par une traduction anglaise
des Mille et Une Nuits ? que je sache,
Galland écrit toujours génie pour rendre l'arabe al-ǧinn. D'un
autre côté, Hugo écrit avant la célèbre traduction anglaise
par Edward
Lane.) En tout état de cause, je propose de
transcrire jihâd ou même gihâd si on ne peut pas
écrire ǧihād, et de prononcer [ʒ] en français (mais quand même
[dʒ] en anglais).
Je suis un grand fan de la
méthode Assimil pour
l'apprentissage des langues (je
l'ai déjà dit,
à plusieurs reprises). Je pense
que c'est la méthode la plus efficace pour apprendre des
langues en ce qui me concerne : je ne pense pas qu'elle soit
forcément la plus efficace pour tout le monde, mais pour ceux qui,
comme moi, ont surtout une mémoire auditive, la méthode Assimil avec
ses enregistrements est sans doute parmi ce qu'il y a de mieux. Comme
je suis un dilettante professionnel, je ne vais jamais jusqu'au bout
de la méthode (seule exception, l'Assimil d'allemand « avancé »). Du
coup, je mesure ma connaissance d'une langue en nombre de leçons
d'Assimil suivies (ça va généralement jusqu'à 100, sauf qu'en fait ce
serait 149 puisqu'à partir de 50 on doit reprendre la
leçon n−49 de façon plus active dans ce qu'ils appellent la
« deuxième vague »). C'est ainsi que j'en suis actuellement à 25½
pour le chinois (je pensais que
j'aurais abandonné avant, mais ça ne saurait tarder), je suis arrivé à
78 pour le suédois, 5 pour le russe « avancé » (je me suis surtout
rendu compte que j'aurais voulu plus de révisions grammaticales et
moins de vocabulaire qu'il n'en proposait), 70 (la fin) pour
l'allemand « avancé », 54 pour le néerlandais, 42 pour l'arabe, 13
pour le japonais, et 12 pour le hongrois (bon, là c'était juste pour
avoir une toute petite idée de la langue avant de passer une semaine à
un congrès à Budapest). Je peux aussi mettre 0 pour le portugais
parce que je l'ai acheté mais même pas sorti de sa boîte. (Il y a
d'autres langues dont j'ai appris des notions autrement que par la
méthode Assimil, mais pas grand-chose.) Je n'exclus pas d'augmenter
ces chiffres, même s'il est toujours un peu délicat de redémarrer un
apprentissage qu'on a commencé et interrompu, et toujours plus amusant
d'essayer de commencer une autre langue lorsque comme c'est mon cas on
veut juste voir du paysage et pas vraiment communiquer avec qui que ce
soit.
(Surtout qu'Assimil s'est mis à faire des méthodes
pour les langues anciennes. Il y avait depuis longtemps un Assimil de
latin, en fait constitué de traductions de leurs méthodes d'autres
langues, et qui n'hésitaient pas à raconter les histoires de gens
partant en vacances en voiture ; mais ils l'ont complètement réécrit
avec des textes un peu plus « authentiques », et ils ont aussi fait
des méthodes de grec ancien, sanskrit et égyptien hiéroglyphique.
Bon, je ne suis pas super convaincu de leur sérieux : le sanskrit,
passe encore, il y a des vrais gens qui parlent couramment le
sanskrit, c'est une langue zombie parce qu'elle continue à remuer
alors qu'elle est censée être morte ; mais l'égyptien ancien, vu qu'on
ne connaît même pas les voyelles de la plupart des mots, ça me paraît
un peu farfelu d'apprendre à le parler. Qu'importe !, c'est rigolo,
et c'est ça qui compte. Donc je salue l'initiative.)
Évidemment, il ne faut pas s'attendre à parler couramment la langue
au bout de 100 ou 149 leçons !, ils annoncent cibler le niveau B2
du cadre
européen commun à la fin de l'Assimil « normal » (qui s'appelait
autrefois sans peine, mais les nouvelles éditions n'ont plus ce
titre) et C1 à la fin de l'Assimil « avancé »
(c'est-à-dire perfectionnement) quand il existe ; je trouve ce
système de niveaux assez foireux et mal défini, ne serait-ce que parce
qu'on peut avoir un niveau totalement différent en compréhension et en
expression, à l'oral et à l'écrit, ce qui fait quatre mesures
différentes, mais au moins l'ordre de grandeur est plausible pour ce
que je peux en juger. Et ce n'est vraiment pas mal, en six mois
d'apprentissage en solitaire, d'atteindre un tel niveau. (Il y a bien
sûr des gens particulièrement doués pour les langues qui pourraient
aller beaucoup plus vite, mais le point important est que cette
méthode convient pour tout le monde, ou au moins tous ceux qui ont une
mémoire principalement auditive.)
En revanche, ce qui est à mon avis faux c'est quand ils prétendent
que la méthode demande 20 à 30 minutes d'attention par jour
(c'est écrit par
exemple ici).
Je ne crois pas être particulièrement lent, peut-être un tout petit
peu perfectionniste, mais en ce qui me concerne c'est plutôt 60 à 90
minutes par jour, peut-être même plus. Et encore, il m'arrive souvent
d'étaler une leçon sur deux jours quand je trouve que je ne l'ai pas
bien assimilée.
Le truc est que (même dans la « première vague ») il ne faut pas se
contenter d'écouter deux ou trois fois le texte : il faut l'écouter
jusqu'à ce qu'on le comprenne dans sa langue d'origine en
l'entendant, quitte à commencer par l'écouter par petits bouts de
phrases puis par phrases complètes, puis en entier. Je ne saurais pas
dire combien de fois je dois réécouter un dialogue Assimil avant
d'être satisfait du fait que je le comprends vraiment, parce
que ça varie beaucoup d'une fois sur l'autre (notamment s'il y a plus
de vocabulaire que d'habitude, ou des tournures syntaxiques
délicates), et évidemment d'une langue à l'autre. Mais ce qui est
certain est qu'il ne faut pas « traduire » : il faut vraiment que ce
soit le texte prononcé dans la langue qu'on apprend qui ait un
sens. Je ne lis d'ailleurs la traduction qu'une seule fois, et
encore, en essayant de ne regarder que le mot-à-mot (je ne regarde la
traduction en « bon français » que quand j'ai un doute sur le sens
global). Pour assimiler le sens d'une phrase, j'essaie de m'imaginer
l'action, parfois de faire un bout de mime avec mes doigts en même
temps que je prononce le mot, tout pour éviter de faire une
association avec un mot français (si j'ai vraiment besoin de
dire un mot, je vais parfois essayer de le dire en anglais ou en
allemand, histoire de ne pas faire des connexions trop tentantes).
Tout ça demande beaucoup de temps. Certes moins quand il s'agit
d'une langue de structure proche d'une langue que je connais déjà
(pour le néerlandais, par exemple, je n'ai essentiellement que du
vocabulaire à apprendre) que pour une langue où je dois en plus
obliger mon cerveau à comprendre des nouveaux arrangements
syntaxiques : pour le chinois, par exemple,
les classificateurs
me posent problème à intégrer dans mes circuits mentaux (je ne parle
même pas de les retenir ou de les associer aux bons mots, je n'en suis
pas là, mais de m'habituer à la structure).
Et puis il y a la prononciation. C'est surtout là que les
enregistrements d'Assimil sont précieux, et je passe de nouveau
beaucoup de temps à les écouter et à tenter de reproduire aussi
précisément que je peux la phonétique. Les manuels indiquent certes
la prononciation par une transcription à eux (différente pour chaque
langue, et qui essaie de s'inspirer de l'orthographe française), mais
il faut dire que ce genre de transcription
non-API est (forcément) merdique, et
la description des sons s'adresse aux gens qui ne connaissent rien à
la phonétique[#] et ne vaut pas
l'article L phonology (où L est la langue
en question) sur Wikipédia. Bon, la transcription pourrait servir
pour les cas où l'orthographe de la langue n'est pas en relation
claire avec la prononciation et que les enregistrements ne sont pas
parfaitement audibles ; sauf que ça ne marche pas toujours : en
suédois, par exemple, il est essentiellement impossible de prédire (ou
en tout cas, je n'ai pas trouvé de règle) si la lettre ‘o’ sera
prononcée /uː/ ou /ʊ/ d'une part, ou bien /oː/ ou /ɔ/ d'autre part (il
y a deux questions : le timbre et la longueur ; la longueur se devine
assez bien, mais le timbre, nettement moins), et ces andouilles
arrêtent les transcriptions systématiques au bout de je ne sais plus
quelle leçon et ne prennent pas la peine de la donner au moins
systématiquement pour tout nouveau mot contenant un ‘o’ — et les
enregistrements ne sont pas toujours totalement clairs (et je n'ai pas
non plus trouvé de dictionnaire suédois en ligne avec les
prononciations de tous les mots transcrites de façon inambiguë).
[#] Je pense que
quiconque veut apprendre n'importe quelle langue étrangère
devrait passer d'abord un petit peu de temps à apprendre des notions
générales de phonétique (en gros, la terminologie basique sur
les points
d'articulation,
les modes
d'articulation et ce genre de choses,
les voyelles cardinales, et les
symboles courants de l'alphabet phonétique). La plupart des gens ne
veulent pas faire cet effort, parce qu'ils ont l'impression de perdre
un temps qui pourrait être consacré à apprendre la langue qu'ils
veulent apprendre, mais je pense que c'est une grosse erreur : si on
veut à terme prononcer les choses correctement, il est beaucoup plus
efficace d'apprendre un peu de phonétique.
Chaque leçon d'Assimil est encore suivie de deux exercices, un
exercice de version et un exercice de thème où il faut compléter les
trous, dans les deux cas en reprenant surtout le vocabulaire de la
leçon qui vient d'être vue. L'exercice de version me semble
particulièrement important, j'essaie de le faire uniquement à partir
des enregistrements (pour m'exercer à la compréhension orale) et je ne
regarde le texte écrit que lorsque cinq ou six écoutes m'ont persuadé
que je ne comprendrai décidément pas la phrase, et que je n'arrive
même pas à trouver dans le lexique de quel(s) mot(s) il peut s'agir.
L'exercice de thème me semble moins utile, parce que bien souvent,
même avec juste des pointillés à compléter, on ne peut pas vraiment
deviner quelle tournure ils veulent vous faire retrouver. Je complète
le plus souvent en réécoutant des phrases tirées au hasard par mon
ordinateur parmi les 10–20 dernières leçons (et leurs exercices de
version) ; pour le chinois, j'ajoute encore l'exercice de reconnaître
les tons (et autres phonèmes délicats) des phrases que j'entends, en
revanche j'ai déjà à peu près abandonné l'idée d'apprendre un nombre
non-complètement-ridicule d'idéogrammes (même si je me suis fait un
petit jeu en JavaScript pour ça).
Si j'en profite pour donner un état d'avancement de mon expérience
mnémurgique consistant à voir comment j'arrive à mémoriser le chinois,
elle est peu concluante : je suis un peu moins mauvais que je pensais
pour retenir des idéogrammes, mais ça demande quand même énormément
d'efforts et ça ne m'intéresse pas assez pour que je déploie la
motivation correspondante (il faut bien le dire franchement, ce
système d'écriture est vraiment d'une connerie hallucinante) ;
j'arrive à peu près à mémoriser les tons des mots chinois que je
retiens, mais je ne sais pas bien si je les mémorise comme faisant
partie intégrante de la phonétique du mot ou si ça reste dans mon
cerveau comme une donnée annexe.
Le chinois comme expérience mnémurgique, et autres divagations sur les langues
Je ne trouve pas de mot français
signifiant relatif à la mémoire (comme capacité psychique), à la
capacité et au travail de mémorisation : tous ceux auxquels je
pense (mnémonique, mémoriel, anamnestique, etc.)
ont un sens extrêmement spécialisé ; alors j'en invente un — en
cherchant à créer un hapax chez Google pour éviter tout ce qui aurait
déjà été pollué par des crackpots en tous genres. Je vous invite
cordialement à réutiliser ce mot dans la conversation de tous les
jours et à regarder votre interlocuteur comme un inculte s'il ne sait
pas ce que signifie mnémurgique.
J'ai récemment fait l'acquisition et commencé l'étude de l'Assimil
de chinois. Pour autant, j'hésite à ranger cette entrée dans la
catégorie langues et linguistique de ce blog, parce que mon but
n'est vraiment pas d'apprendre le (ni même, un peu de) chinois, et il
est quasi certain que mon expérience ne durera que très peu de temps :
en fait, le chinois en tant que tel ne m'intéresse que très peu, ce
qui m'intéresse, c'est de m'en servir pour comprendre comment
fonctionne ma mémoire. Généralement, quand j'entreprends l'étude
d'une langue, et même si je ne vais jamais loin faute de patience, ce
qui me motive est une combinaison entre la curiosité de connaître les
principes généraux de cette langue, l'intérêt pour sa phonétique ou sa
grammaire, un certain attrait pour la culture de ceux qui la parlent,
ou une volonté de m'ouvrir l'esprit au sens sapirwhorfien. Mais la
langue chinoise, pour ce qui me concerne à présent, est
essentiellement juste un gigantesque corpus de correspondances syllabe
↔ idée ↔ dessin, complètement dénué de logique, et surtout, dont je ne
connaissais rien a priori. J'aurais pu demander à un
ordinateur de tirer au hasard de telles correspondances, mais tant
qu'à faire, autant m'exercer sur celles que des centaines de millions
de personnes ont apprises : d'autant qu'elles ont l'avantage d'être
dûment documentées et répertoriées, les dessins d'être largement
disponibles sur ordinateur, et les sons d'être disponibles sous forme
pré-enregistrée dans ce qui fait l'intérêt de la méthode Assimil.
L'expérience mnémurgique est double. (1) D'abord savoir si
j'arrive à retenir les tons, sachant que j'ai une bonne oreille
phonétique mais que je n'ai jamais vraiment entrepris d'apprendre une
langue tonale. (J'ai fait un petit peu de suédois et de grec ancien,
mais je pense qu'il faut distinguer une langue ayant
des accents tonaux, comme les deux que je viens de citer, et
une langue véritablement tonale, même si comme d'habitude en
linguistique les distinctions sont un peu floues ; toujours est-il que
l'effort de mémoire ne me semble pas du tout comparable.)
(2) Ensuite, savoir si j'arrive à apprendre à reconnaître quelques
idéogrammes[#]. Là aussi, je
n'ai jamais vraiment entrepris d'apprendre un système d'écriture
idéographique : j'ai fait un tout petit peu de japonais, mais je m'en
suis tenu aux syllabaires, et j'ai déjà eu assez de mal avec ; et j'ai
appris une quantité encore plus infinitésimale d'égyptien
hiéroglyphique, dans lequel à peu près tout ce que je sais
dire/écrire,
c'est 𓏇𓇋𓅱𓃠𓅓𓉐𓏤
— le chat est dans la maison — et à part le dessin du chat, ce
n'est pas terriblement idéographique, c'est même vaguement
alphabétique.
Le (2) m'intéresse moins parce que je suis presque sûr que la
réponse est non, ou alors au prix d'efforts bien au-delà de ce que
je suis prêt à consentir. Le problème est que j'ai une mémoire
visuelle incroyablement nulle. En fait, j'ai une capacité
d'observation incroyablement nulle. (Quite
so, [Holmes] answered, lighting a cigarette, and throwing himself
down into an armchair. You see, but you do not observe. The
distinction is clear.) Par exemple, il m'est arrivé plus d'une
fois qu'on me demande si quelqu'un que je connais très bien et que
je vois presque tous les jours porte des lunettes, et je me rends
compte avec horreur que je n'en ai aucune idée. Il est probable que
ce ne soit pas exactement la même capacité qui soit en jeu, mais c'est
certainement mauvais signe. D'ailleurs, l'autre jour, j'ai passé très
longtemps à regarder les deux glyphes
和et知
(ils font partie des 200 caractères chinois les plus fréquents ; je
vais supposer que tout le monde a des polices installées permettant de
les voir), en cherchant quelle pouvait bien être la différence. J'ai
même recopié les dessins à la main, et je n'arrivais toujours pas à
voir la différence dans ce que j'avais moi-même dessiné !
Pourtant, l'ordinateur me disait qu'il y en avait une, ne serait-ce
que dans les numéros Unicode U+548C
et U+77E5. Ce n'est même pas un problème de ne pas
comprendre : il m'est arrivé aussi de regarder pendant longtemps deux
phrases en français, deux énoncés mathématiques, ou deux lignes de
code légèrement différents et de chercher en vain la différence.
(Combien souvent il m'est arrivé de lire un livre de maths qui
explique on a le théorème <…> ; en revanche, on se gardera
bien de croire que <…>, qui est faux comme on s'en convainc
facilement et de passer un temps fou à chercher la différence
entre les deux affirmations.) Je pourrais dire, encore un effet de
la lecture en diagonale, mais
j'étais complètement nul au jeu des sept erreurs déjà
quand j'étais petit. En revanche, je ne suis pas dyslexique, et je ne
sais pas comment cela se fait quand je mets ça en regard de cette
difficulté que je décris à observer les choses. Bien sûr, une fois
que je remarque la différence, par exemple entre les deux idéogrammes
ci-dessus, elle me semble tellement énorme que je ne comprends pas
comment j'ai pu la rater (et comment j'ai réussi à reproduire les deux
sans remarquer que je ne dessinais pas la même chose).
Outre ma capacité d'observation nullissime, ma patience est aussi
assez limitée pour apprendre des arrangements essentiellement
aléatoires de lignes : je n'ai aucune envie d'apprendre à les tracer
moi-même, ce qui est peut-être indispensable à leur mémorisation, et
j'ai consulté des sites d'étymologie graphique du chinois
(genre celui-ci) en
espérant que ça aide à retenir les zigouigouis, mais c'est
complètement décevant, j'ai beau avoir toutes les informations que je
veux sur le nombre de traits, la « clé », la décomposition graphique,
l'origine, etc., ça reste des zigouigouis informes pour mon cerveau.
J'aurais peut-être plus de facilité à retenir les numéros Unicode, en
fait. Mais bon, je vais essayer de persévérer un petit peu plus
longtemps avant d'abandonner complètement le (2).
[#] Je profite du
passage qui précède pour rappeler que je refuse d'utiliser le mot
ridicule de sinogramme pour désigner les caractères chinois —
que certains préfèrent à idéogramme parce que ces gens ont une
idée extrêmement limitée de ce qu'est, justement,
une idée. J'accepterai de parler de
sinogrammes quand le terme d'égyptogrammes sera devenu le terme
le plus courant pour parler des hiéroglyphes égyptiens (et qu'on dira
aux enfants en CP qu'on va leur apprendre
les romaikogrammesroméogrammes).
Bon, mais le (1), c'est-à-dire la question de la mémorisation des
tons, m'intéresse plus. J'ai remarqué que quand on est confronté à un
phénomène phonétique, il y a trois étapes de difficultés croissante :
(a) arriver à (re)produire le phénomène, (b) arriver à
l'entendre, et (c) arriver à lui créer une case mnémurgique
dans le cerveau.
(a) Prononcer des sons précis n'est, à mon avis, pas très
difficile : il y a bien longtemps, j'ai pris le manuel de l'alphabet
phonétique international, j'ai regardé tous les signes qui y figurent,
et je me suis convaincu qu'il n'y avait pas de difficulté fondamentale
à prononcer la grande majorité d'entre eux (je ne dis pas que je sache
tout faire : je n'ai jamais compris comment opposer une pharyngale et
une épiglottale, par exemple, et j'avoue que quand je regarde la
phonologie de
la langue
xhosa[#2], j'ai très peur ;
mais globalement, si on me dit de prononcer une affriquée
alvéolo-palatale sourde aspirée et labialisée, par exemple, je sais
faire). Il peut y avoir difficulté à articuler successivement
plusieurs sons qu'on sait réaliser isolément, mais dans l'ensemble, ce
n'est pas la prononciation qui est problématique.
[#2] Le xhosa n'est
peut-être pas le
pire. Ici il
est question d'un clic palatal selon une nasale pulmoniquement
ingressive sourde à aspiration retardée ou d'un clic dental
selon une plosive uvulaire prénasalisée suivie de frottement
vélaire, ce qui ressemble plus à un phonétigasme de linguiste qu'à
quelque chose de véritablement prononçable par l'anatomie humaine,
donc je pense que ces gens doivent être surhumains. J'aime aussi
beaucoup la phrase : Taa may have as few as 83 click
sounds, if the more complex clicks are analyzed as clusters.
(Remarquez qu'à côté de ça, ils n'ont pas le son [b]. Trop compliqué,
sans doute.)
La langue
oubykh n'est pas mal non plus, même si pour le coup c'est plutôt
le fait qu'on arrive à distinguer tant de consonnes, donc le (b)
ci-dessous, que leur réalisation elle-même, qui m'impressionne.
(b) Entendre, i.e., distinguer, des phénomènes phonétiques
dont on n'a pas l'habitude, est déjà plus délicat. Par exemple, il y
a quelques années, j'ai décidé de commencer à distinguer les sons /ɛ̃/
(la voyelle de brin) et /œ̃/ (la voyelle de brun) en
français, alors que mon accent « maternel » les
confond. Prononcer la différence ne me posait aucune
difficulté (prononcer les mots père et peur, mémoriser
la différence de position des lèvres, et reproduire celle-ci après
nasalisation) : mais je n'entendais aucune différence dans ce
que je prononçais. Mais à force de m'obliger à faire systématiquement
la distinction, j'ai fini par l'entendre, ce qui était le but de
l'exercice. Depuis, je me suis efforcé d'entendre toutes sortes
d'autres différences phonétiques (et non nécessairement phonémiques),
par exemple la position précise des voyelles des gens qui parlent
anglais : l'exercice présente des
risques, à la manière dont Knuth racontait que depuis qu'il
s'était mis à composer des polices de caractères il ne pouvait plus
commander dans un restaurant parce qu'il était trop occupé à regarder
les polices du menu : je me retrouve parfois à ne pas écouter ce
que les gens disent parce que je fais trop attention
à comment ils le disent ; mais tout ça pour dire que ce n'est
pas très difficile avec de l'entraînement.
Et notamment, il est faux qu'on ne peut entendre correctement que
des différences qui existent dans sa langue maternelle : je n'ai
jamais eu de mal à distinguer une sourde d'une sourde aspirée, par
exemple, alors qu'avant le chinois je n'avais jamais appris un seul
mot d'une langue qui les contraste (l'anglais n'a pas la même consonne
‘p’ dans pin et dans spin,
la première est légèrement aspirée et la seconde ne l'est pas, mais
cette distinction n'est pas contrastive, elle est mécaniquement due à
la présence du ‘s’). Mais dans l'autre sens, j'ai la plus grande
difficulté à entendre la différence entre une occlusive vélaire et une
occlusive uvulaire (le ‘k’ et le ‘q’ de l'arabe standard), même si je
sais les prononcer : si je m'amuse à parler en français en remplaçant
toutes les occlusives vélaires par des uvulaires, j'entends bien que
ça donne un accent bizarre, mais sur un son isolé, j'entends à peine
la différence.
Il est certain aussi qu'on peut apprendre à reproduire des
phénomènes phonétiques sans en avoir conscience. J'ai appris
l'allemand à l'école, par exemple, et je n'ai pas eu tant que ça
l'occasion d'écouter des locuteurs natifs parler. Pourtant, quand on
m'a fait remarquer que la terminaison -er (par exemple dans un mot
comme Berliner) est une voyelle en
allemand (un schwa ouvert [ɐ] ; en fait, le ‘r’ allemand standard se
vocalise dans plus ou moins les mêmes conditions que le ‘r’ des
accents anglais non rhotiques, mais sur un schwa plus ouvert), j'ai
été surpris de découvrir que c'était effectivement comme ça que je le
prononçais alors que personne ne m'avait jamais dit qu'il fallait
faire comme ça. Pour autant, je suppose qu'il est plus efficace,
quand on s'adresse à quelqu'un qui connaît la terminologie générale de
la phonétique, de lui donner les règles, au moins les plus
importantes, au lieu de le laisser patauger à les découvrir lui-même :
mais c'est une question non évidente dans l'apprentissage des langues
(entre donner des règles potentiellement complexes ou laisser le
cerveau les découvrir « naturellement », il faut trouver un
équilibre).
Bon, mais même si on arrive à réaliser et à entendre une
différence, il reste un troisième point non évident : (c) la
mémoriser. Le fait est que la mémoire filtre tout ce qui semble sans
importance dans un énoncé : si quelqu'un me dit quelque chose
aujourd'hui, je retiendrai le sens général plus facilement et plus
longtemps que les mots précis, et je retiendrai les mots précis plus
facilement et plus longtemps que les détails phonétiques même si
je suis capable de les entendre. (De même, si je lis un texte
écrit, je vais retenir les idées plus facilement que les mots précis,
et les mots précis plus facilement que les détails de la police de
caractères ou de la position de chaque mot sur la ligne de
texte, même si je suis capable d'observer ces détails au
moment de la lecture.) Or pour apprendre une langue, il faut
convaincre les circuits mnémurgiques du cerveau de conserver les
informations pertinentes pour cette langue, et ça, ce n'est
pas du tout facile, et je cherche encore les techniques pour y arriver
efficacement.
Par exemple, j'ai parlé du ʿayn
dans une entrée passée : quand j'ai appris un peu d'arabe, je n'avais
aucune difficulté à prononcer ce son, ou à l'entendre dans un mot
donné, mais si j'essayais de mémoriser un mot contenant un ʿayn, une
fois sur deux, ma mémoire me le ressortait plus tard avec un ʿayn
remplacé par un ‘r’. Pourtant, ces sons ne se ressemblent
pas, pas même vaguement : mais ce qui se passe est que le
ʿayn arabe ressemble vaguement au ‘r’ français, le ‘r’ arabe est
transcrit par la même lettre que le ‘r’ français, et donc mon cerveau
avait tendance à classifier le ʿayn comme une variante du ‘r’ et à
confondre les deux.
Je reviens au chinois. Si on met les tons de
côté, la
phonologie du chinois standard est plutôt simple, au moins du
point de vue de celui qui cherche à apprendre la langue, parce que le
nombre de phonèmes est plutôt réduit, ils sont assez faciles à
articuler et assez différents à l'oreille (à part des cas
comme ri contre re — dans la transcription pīnyīn —,
c'est-à-dire quelque chose comme /ɻ̩/ ou /ɻɨ/ contre /ɻɤ/ en alphabet
phonétique, ou peut-être ji /t͡ɕi/ contre qi /t͡ɕʰi/ parce
que la palatalisation rend l'aspiration moins audible). Même
l'ensemble des combinaisons possibles pour former une syllabe est
réduit, quelque part entre 404 et 412 selon ce qu'on compte
exactement. (Du point de vue du linguiste, il y a des questions
potentiellement délicates — peut-être intéressantes, mais peut-être
aussi simplement oiseuses — sur la façon la plus économique ou
pertinente d'analyser la combinatoire des syllabes chinoises : par
exemple, se demander si les syllabes transcrites si
et xi en pīnyīn finissent par le même phonème, ou de même
combien parmi celles transcrites le, lie, luo
et lüe. Mais celui qui apprend la langue se moque bien de
savoir si deux sons qui lui paraissent de toute façon différents sont
différents parce que ce sont des allophones d'un même phonème ou parce
que ce sont des phonèmes différents ; et je ne suis pas persuadé que
la question ait un sens plus profond qu'une simple convention sur la
description la plus agréable.)
Les tons sont, il me semble, faciles à produire, et pas trop
difficiles à entendre. (Au moins si on nous donne cette information
cruciale que le 3e ton est prononcé comme le 2e ton lorsqu'il est
suivi d'un autre 3e ton, et grave lorsqu'il est suivi d'un ton
différent : ce que l'Assimil ne disait pas, et franchement,
s'attendre que les gens l'infèrent par eux-mêmes en écoutant les
enregistrements, je trouve ça un peu coton[#3]. Après, je vois
que des
thèses entières ont été consacrées à la question de comment
expliquer le 3e ton aux étrangers qui apprennent le chinois.)
[#3] D'ailleurs, je me
demande bien comment le cerveau des petits enfants qui apprennent une
langue fait pour découvrir les motifs de ce genre, ou plus compliqués,
parfois complètement cinglés, que les langues vivantes semblent avoir
le don pour s'inventer : je disais plus haut que j'avais appris sans
m'en rendre compte la manière dont le ‘r’ allemand se vocalise, mais
ça a l'air plutôt simple même par rapport aux règles, sur,
disons, la
fermeture de la première composante des diphtongues /aɪ/ et /aʊ/,
que je n'ai pas acquise (ou alors, si je l'avais acquise, que
j'ai perdue avant d'apprendre à la remarquer).
Un signe qu'on peut être tout à fait sensible à l'intonation même
dans une langue non tonale m'a frappé dans le RER B à la
station Orsay-Ville : la voix automatique qui lit les noms des
stations prononce Orsay. Ville. : le son est parfait (je
suppose que c'est un enregistrement, pas une voix de synthèse), mais
l'intonation, descendante sur chaque partie, est complètement bizarre,
comme si elle prononçait deux phrases d'un seul mot, au lieu de lire
le nom composé Orsay-Ville. (Bon, il y a peut-être aussi une
pause excessive entre les deux mots qui renforce cette impression,
mais ce n'est certainement pas tout.)
Mais même si j'arrive à entendre correctement les tons du
chinois (ce qui semble être à peu près le cas), la difficulté, et
l'intérêt de l'expérience, est la partie (c) : savoir si je vais
convaincre mon cerveau de les mémoriser, et de les
mémoriser avec la syllabe, comme partie intégrante de l'unité
lexicale, et pas comme une donnée auxiliaire à la manière de
l'intonation.
Cela n'aide pas que le système de transcription choisi (le pīnyīn)
utilise des diacritiques pour représenter les tons : du coup, ceux-ci
sont considérés comme plus ou moins optionnels par ceux qui recopient
ces transcriptions. Quand on n'utilise pas le nom
francisé Pékin (qui est irréprochable parce que c'est un mot
français, du coup, à la manière de Londres, Munich, Florence ou
Moscou), la capitale chinoise est appelée Beijing parce que les
gens ont la flemme d'écrire Běijīng — c'est catastrophique pour
les gens qui veulent apprendre le chinois, parce que soit cela les
encourage à ne pas mémoriser les tons comme quelque chose d'absolument
indispensable, soit cela les oblige à faire semblant de ne pas avoir
la moindre idée de comment s'appelle en chinois la capitale chinoise.
Mais bon, j'ai déjà râlé sur le
fait qu'une bonne translitération doit avec des propriétés
d'inversibilité, et je pourrais pester des heures sur les gens qui
transcrivent l'arabe en enlevant les ʿayn et ʾalif et les diacritiques
qui indiquent les consonnes « emphatiques » (pharyngalisées), ou
encore les gens qui transcrivent le russe n'importe comment (il faut
dire que le seul mécanisme correct de transcription du
russe, ISO 9, n'est quasiment pas utilisé). Il
aurait été tellement préférable qu'on eût choisi de transcrire les
tons du chinois par des vraies lettres, si bien que personne n'aurait
eu l'idée saugrenue de les ignorer : par exemple, si je devais
reconcevoir le système, je noterais zy, cy et sy
ce qui est noté j, q et x respectivement en
pīnyīn, ce qui serait plus logique et libérerait du même coup les
trois lettres en question pour coder les tons sans avoir à faire appel
à des diacritiques (et peut-être que la capitalie chinoise aurait un
nom plus difficilement lisible, comme Beixzyingj, mais ce ne
serait pas pire que l'irlandais en
matière de lettres bizarres).
En tout cas, pour l'instant, ma conclusion sur (1) les tons est à
peu près aussi négative que sur (2) les idéogrammes : je retiens à peu
près les tons des mots que j'apprends mais je ne les retiens pas
dans la même unité mnémurgique que les sons eux-mêmes (i.e., si
je cherche à retrouver un mot, j'ai d'abord une
prononciation-sans-tons qui me vient à l'esprit, puis, en
faisant plus d'efforts, donc en cherchant apparemment dans une région
différente de mon cerveau, des tons qui viennent s'y ajouter), c'est
donc un échec pour l'instant, mais je suis curieux de savoir si cela
va évoluer avant que ma patience à passer une heure par jour à faire
du chinois ne s'épuise (i.e., vite). Car bien sûr, tout ça
est une question d'efforts consentis : je suppose qu'on finit par y
arriver, la vraie question est de savoir ce que ça coûte (le mythe
selon lequel les adultes apprennent moins bien les langues que les
petits enfants parce que leur cerveau est moins flexible a été pas mal
démonté : le problème est surtout que les adultes ont moins de temps à
consacrer et n'ont personne pour les corriger quand ils parlent
mal).
Ajout () : Sur le fait que
les adultes apprennent moins facilement les langues que les enfants,
et des raisons possibles pour
ça, cette vidéo, bien qu'il s'agisse essentiellement d'une pub
pour un site Web pour l'apprentissage des langues, est intéressante à
regarder. (Voir aussi ce que j'écris
dans mon billet sur la méthode
Assimil.)
Mais je suis étonné que peu de gens abordent la question. Il y a
toutes sortes de pages en ligne qui discutent de moyens
mnémotechniques pour le chinois, et notamment pour les tons (voir par
exemple cette
discussion), mais d'une part beaucoup s'adressent à des gens qui
ont plutôt une mémoire visuelle (par exemple, colorier les idéogrammes
selon leur ton), et d'autre part, comme je l'explique ci-dessus, je
trouve que c'est une question différente de
(i) simplement mémoriser les tons que de (ii) forcer le
cerveau à les mémoriser exactement au même emplacement que la syllabe
elle-même : si mon but était d'apprendre le chinois, ce qui n'est
pas le cas, les moyens mnémotechniques pour mémoriser les tons
séparément de la syllabe pourraient m'intéresser, mais je ne cherche
pas à apprendre le chinois, je cherche à savoir si (ii) est
atteignable et comment (et à la limite, si je me rends compte qu'il
est atteignable, ou si je me rends compte qu'il ne l'est pas, je peux
arrêter le chinois, parce que c'était simplement ça le but recherché).
Maintenant, il est aussi possible que (ii) vienne naturellement si on
réalise (i) ; toujours est-il que la réponse ne semble pas se trouver
en ligne. (Bizarrement, plus de gens sont intéressés à apprendre le
chinois pour apprendre le chinois que pour comprendre le
fonctionnement du cerveau humain. Comme c'est étrange.)
…dans le cadre d'un cours dont j'enseigne à un groupe…
que j'affirme être correcte (j'enseigne à un groupe [d'élèves] de
ce cours) mais qui a fait réagir le genre de
grincheux dont j'imagine qu'ils doivent lire des blogs sans aucun
intérêt pour le fond, par simple plaisir de pinailler sur la
grammaire. Penchons-nous donc un instant sur les subordonnées
relatives en français. [En vérité, l'avant-dernière phrase est
surtout là pour fournir quelques exemples
intéressants in situ de subordonnées
compliquées : la phrase que j'affirme être correcte
et les grincheux dont j'imagine qu'ils doivent lire des blogs
blablabla.]
La subordonnée relative, dans les langues que je connais assez bien
pour m'exprimer à leur sujet, a pour fonction de prendre deux phrases
faisant intervenir le même concept, plus exactement un groupe nominal
(ou un pronom), et d'imbriquer une dans l'autre (l'imbriquée devient
donc la proposition subordonnée tandis que l'imbriquante
devient la proposition principale) en explicitant le fait
que c'est bien le même concept qui intervient dans les deux phrases.
Exemple extrêmement simple :
{J'aime la maison} # {Je
vois la maison} →
{J'aime la maison
{que je vois}}
(L'opération n'est pas commutative : dans l'autre sens on
obtiendrait Je vois la maison
{que j'aime}, ce qui a un
sens subtilement différent, mais je vais y revenir.)
Le mot que indiqué en rouge est
le pronom relatif ; il a un double rôle : (A) introduire la
subordonnée (marquer son début, c'est-à-dire, débuter l'imbrication)
et (B) préciser la fonction occupée par le groupe commun
(l'antécédent de la relative) dans cette subordonnée. On
va voir ci-dessous que ces rôles sont un peu en conflit et qu'il
serait beaucoup plus clair d'avoir deux mots séparés pour les remplir.
Le point à souligner dans (B) est que normalement en français la
fonction d'un groupe nominal est indiquée par l'ordre des mots, mais
comme on a réordonnée les mots pour mettre le pronom relatif en
premier (à cause de son rôle (A)), cette fonction n'est plus
apparente, et on la manifeste, à la place, par la forme du pronom.
Pour reprendre un exemple très simple, comparer :
{Le garçon fait de la muscu} #
{Le garçon drague Kévin} →
{Le garçon
{qui drague Kévin} fait de la
muscu}
{Le garçon fait de la muscu} #
{Kévin drague le garçon} →
{Le garçon
{que drague Kévin} fait de la
muscu}
— la fonction (sujet ou objet) du groupe nominal commun dans la
seconde phrase est indiquée par son emplacement quand la
phrase est autonome, mais par la forme du pronom relatif
(reste de déclinaison latine) quand elle est transformée en
subordonnée.
Ajout () :
J'aurais sans doute dû signaler que dans la seconde
version, le garçon
{que drague Kévin} fait de la
muscu, on peut aussi utiliser l'ordre des
mots le garçon
{que Kévin drague} fait de la
muscu, alors que dans la première il n'y a pas de choix : on peut
donc préciser la fonction dans la subordonnée par le choix du
pronom ou par l'ordre des mots. Il faudrait chercher un
exemple où on ne peut pas jouer avec l'ordre des mots.
Puisque j'en ai parlé dans l'entrée
précédente, je vais raconter des choses sur l'inflexion des
adjectifs dans les langues germaniques. (Si vous lisez cet article
jusqu'au bout, félicitations, vous aurez vous aussi gagné le super
pouvoir de passer pour la personne la plus ennuyeuse dans n'importe
quelle soirée.)
Les langues germaniques sont une sous-branche des langues
indo-européennes. Je commence donc par rappeler certains éléments
grammaticaux importants généralement communs à ces langues. Pour
commencer, ce sont des langues à cas (au moins à l'origine — beaucoup
d'entre elles ont perdu les cas ultérieurement), c'est-à-dire que les
noms ou groupes nominaux portent des inflexions qui indiquent la
fonction de ces groupes par rapport au verbe de la phrase. (Les cas à
l'origine sont : nominatif, vocatif, accusatif, instrumental, datif,
ablatif, génitif et locatif ; peu importe la liste exacte, mais je
veux surtout souligner qu'ils sont en nombre relativement petit et
bien défini, à la différence des langues comme le finnois ou le
hongrois où cette liste n'a pas vraiment de fin.) Ces cas sont
marqués presque uniquement à la fin du mot (on parle de désinences).
De plus, du point de vue de ces cas, les langues indo-européennes font
une distinction principale nominatif-accusatif plutôt
qu'absolutif-ergatif : disons pour simplifier que cela signifie que
dans une phrase comme Pierre frappe Paul, le nom qui effectue
l'action désignée par le verbe frapper (Pierre, qui sera au cas
appelé nominatif ou cas « sujet ») aura un rôle grammatical
plus central que le nom qui la subit (Paul, qui sera au cas
appelé accusatif) — cette centralité se voit dans le fait que
s'il y a une seule personne connectée à l'action (Jacques
tombe), le cas de cette personne sera le même que le cas de la
personne qui effectue l'action (donc, le nominatif), que si le verbe
s'accorde dans cette situation (Jacques tombe → Jacques et
Jules tombent) alors il
s'accorde de la même façon avec le « sujet » de l'action (Pierre et
Luc frappent Paul
contre Pierre frappe Paul et Marc sans variation), et que si la
même personne effectue deux actions on peut faire une ellipse (la
phrase Pierre frappe Paul et Pierre tombe peut se redire
en Pierre frappe Paul et tombe, alors que Pierre frappe Paul
et Paul tombe ne peut pas se redire avec ellipse) ; à l'inverse,
dans une langue à opposition absolutif-ergatif, c'est le cas de Paul
dans Pierre frappe Paul, appelé absolutif, qui est utilisé
pour Jacques tombe et non celui de Pierre (l'ergatif), mais je
digresse.
Une autre caractéristique grammaticale des langues indo-européennes
est que les adjectifs sont plus ou moins rapprochés des noms : comme
les noms, les adjectifs peuvent varier selon le cas, ils s'accordent
aussi en nombre et en genre avec le nom (cf. ci-dessous), en revanche
ils n'ont pas les dimensions d'inflexion qui caractérisent les verbes
(mode, temps, aspect) ; par comparaison, en japonais, les adjectifs
(au moins les adjectifs en -い) ressemblent plus à des verbes, et
peuvent se mettre, par exemple, au passé. Ceci peut s'analyser en
disant que dans les langues indo-européennes, la fonction « normale »
de l'adjectif est épithète (la mer bleue) alors que dans
d'autres langues la fonction « normale » serait d'être attribut (la
mer est-bleue, l'adjectif signifiant être-bleu).
Enfin, les langues indo-européennes distinguent trois nombres, le
singulier, le duel et le pluriel, même si le duel est réduit à l'état
de trace ou d'archaïsme dans quasiment toutes les langues
indo-européennes vivantes (désolé, le slovène !). Et elles
distinguent trois genres, le masculin, le féminin, et le neutre, même
si plusieurs ou tous ces genres ont pu fusionner dans beaucoup de
langues encore vivantes, et même si à l'origine le statut du féminin
n'est pas clair (il est probablement dérivé d'une forme de collectif,
ce qui explique pourquoi le neutre pluriel et le féminin singulier ont
une grande parenté).
J'en profite pour noter que quasiment tout ce que
je viens de dire — l'existence de cas, l'opposition
nominatif/accusatif, avec variation du verbe selon le sujet, plutôt
qu'absolutif/ergatif, l'opposition nom/verbe avec rapprochement des
adjectifs aux noms, l'existence d'une distinction de nombre et
peut-être même singulier/duel/pluriel, et l'existence d'une
distinction de genre avec une similitude entre le féminin singulier et
l'inanimé pluriel (jusqu'à l'accord des verbes au singulier dans cette
situation) — est aussi vrai pour les langues sémitiques comme l'arabe.
Je trouve qu'il s'agit d'indices assez forts pour penser qu'il y a,
sinon parenté, du moins influence grammaticale, entre ces deux
familles de langues, et je trouve ça beaucoup plus remarquable que
d'éventuels rapprochements entre racines lexicales douteuses. Mais de
nouveau, je digresse complètement.
Le schéma général de l'adjectif dans les langues indo-européennes
est, donc, est qu'il s'accorde en genre, nombre et cas avec le nom
auquel il se rapporte. L'accord en nombre n'appelle pas spécialement
à commentaire (je me retiens très fort de vous parler des numéraux
dans les langues slaves). L'accord en cas n'en mérite pas non plus si
l'adjectif est épithète (pour la mer bleue, le bleu sera
au même cas que mer, que ce groupe soit sujet, objet, objet
indirect, ou tout autre cas) : dans le cas de l'attribut (la mer
est bleue), le cas est a priori nominatif, même s'il faut
évoquer la possibilité d'un attribut du complément d'objet (la mer,
je l'imagine bleue) auquel cas l'adjectif devrait logiquement être
à l'accusatif, mais je n'ai pas assez de recul sur un ensemble
raisonnable de langues indo-européennes à cas pour pouvoir dire si
cette logique est largement suivie. (Par ailleurs, la règle de
l'attribut du sujet au nominatif ne s'applique pas que pour un
adjectif mais si l'attribut est lui-même un nom ou un groupe
nominal : Socrate est un homme mettra normalement un
homme au nominatif dans les langues indo-européennes. Cependant,
cette logique ne vaut que pour la forme la plus basique, et parfois
omise, du verbe être : en russe, par exemple, Socrate est un
homme se dit Сократ — человек,
mais Socrate était un homme donne Сократ был
человеком, l'attribut passant du
cas nominatif человек au cas
instrumental человеком ;
de nouveau, je trouve amusant qu'on voie un phénomène analogue en
arabe classique où l'attribut marqué sans verbe commande le cas
nominatif tandis que l'attribut marqué avec le
verbe كان, par exemple pour exprimer le passé,
commande le cas accusatif/direct. Zut, j'ai encore digressé.)
L'accord en genre mérite l'explication suivante que le genre dans
les langues indo-européennes a plusieurs visages ou recouvre plusieurs
phénomènes. (1) Il est une caractéristique lexicale
intrinsèque des noms communs, c'est-à-dire que chaque nom commun (si
la langue a gardé des genres) appartient à tel ou tel genre, et ce, de
façon essentiellement arbitraire : en français, le soleil est
lexicalement masculin, la lune est lexicalement féminin, tandis
qu'en allemand, die Sonne (le soleil) est féminin
et der Mond (la lune) est masculin. (2) Il est
aussi un élément sémantique lorsqu'il se rapporte à une
personne, indiquant à quel sexe il est considéré par le locuteur comme
appartenir : c'est-à-dire que certains énoncés, nonobstant le (1)
ci-dessus, apportent une information sur le sexe du locuteur ou de la
personne à laquelle il s'adresse, ou de tiers désignés par des prénoms
ou des noms épicènes. (Ainsi, en français, écrire tu es fou
plutôt que tu es folle reflète l'information qu'on s'adresse à
une personne considérée comme de sexe masculin. Il ne s'agit pas ici
du genre lexical d'un nom commun.) (3) Dans le cas des adjectifs (ou
apparentés : formes verbales à participes), le genre est un élément
d'accord, reflétant le genre (au sens (1) ou (2)) du nom auquel
l'adjectif se rapporte. (4) Le genre commande aussi à un choix de
pronoms (en français, il contre elle, en
anglais he contre she). • En
clair, (1) un nom commun est masculin, féminin ou neutre
(selon ce que la langue admet comme genres), mais toujours du même
genre pour le même nom (à de rares exceptions près), tandis que
(3) un adjectif est accordé au masculin, féminin ou
neutre selon le nom auquel il se rapporte. Un nom a un genre
intrinsèque, un adjectif n'en a pas. Et dans des cas comme celui où
l'adjectif se rapport non pas à un nom mais à un pronom ou un nom
propre (p.ex., prénom), l'accord est sémantique (c'est le point (2)).
(Quant au choix (4) des pronoms pour reprendre un nom, il dépend
(1) du genre lexical du nom et/ou (2) de la sémantique, typiquement
quand il s'agit d'une personne.)
Au niveau inflexionnel, les langues indo-européennes ont donné aux
adjectifs des désinences masculines, féminines et neutres calquées sur
les paradigmes des noms les plus souvent du genre correspondant.
Ainsi, en latin, le masculin bonus se décline
comme dominus (classe de noms majoritairement
masculins), le féminin bona
comme rosa (classe de noms majoritairement
féminins), et le neutre bonum
comme templum (classe de noms exclusivement
neutres) : les désinences de trois classes de noms différents se
retrouvent dans une seule classe d'adjectifs pour former les trois
genres. (Mais l'accord est véritablement selon le genre et pas selon
la classe flexionnelle du mot : ainsi dans les rares situations de
noms féminins du paradigme dominus ou de
masculins du paradigme bona, on accorde bien
l'adjectif avec le genre, par exemple Sequana longus
est, la Seine est longue, le nom du fleuve Sequana
étant masculin en latin malgré sa terminaison en -a et bien qu'il ait
donné un féminin en français.)
⁂ Tout ceci concernait les langues indo-européennes en général.
Les langues germaniques apportent l'innovation qu'en plus de faire
varier les adjectifs en genre, nombre et cas, elles introduisent une
dimension de plus à leur inflexion, la distinction
indéterminé/déterminé. Cette distinction concerne uniquement les
adjectifs (les langues scandinaves ont innové en introduisant une
distinction similaire pour les noms, j'y reviendrai) ; et elle à
l'origine a un caractère sémantique : elle distingue le
beau garçon et un beau garçon (si j'arrive à
pipoter correctement le vieil allemand, ça devrait
être scōno
knabo et scōni
knabo respectivement), autrement dit, à l'origine, le choix
d'accorder l'adjectif en indéterminé ou en déterminé va apporter une
vraie différence de sens. Mais les langues germaniques ont ensuite
repris des démonstratifs comme articles, rendant cette distinction
redondante avec la présence de l'article défini : ceci transforme
alors une distinction sémantique en un accord grammatical selon la
présence ou non de tel ou tel article. (Exemple toujours en vieil
allemand mais avec l'article explicitement
écrit, dër scōno
knabo, soit en allemand moderne der
schöne Knabe, le beau
garçon,
contre scōni
knabo, ein
schöner Knabe, un beau
garçon ; ou pour reprendre exactement les mêmes mots en vieil
anglais, se scēna
cnafa
contre scēne
cnafa, ce qui en anglais moderne-mais-précieux
serait [the] sheen knave, mais les désinences ont
alors totalement disparu.)
Zut, je voulais reprendre le vers
du Roi
des aulnes pour mon exemple, mais je me suis mal rappelé
celui-ci : dans le poème de Goethe, c'est feiner
Knabe (pour ma défense, schöner Knabe
scanderait tout aussi bien). Comme fein ne
semble pas venir d'une racine germanique, je ne change pas.
Cette distinction déterminé/indéterminé à
l'adjectif est une spécificité des langues germaniques qui ne se
retrouve pas dans les autres langues indo-européennes, même s'il y a
quelque chose de vaguement semblable dans la famille balto-slavique
(une sorte de déterminant postposé qui explique notamment pourquoi les
adjectifs épithètes en russe ont une déclinaison manifestement
double), mais je ne développe pas plus.
Encore quelques réflexions décousues sur l'écriture, la ponctuation et la typographie
J'évoquais l'an dernier, au
milieu d'autres problématiques du même acabit, la question un peu
byzantine suivante : si on admet que le français utilise, dans ses
conventions typographiques, des guillemets différents de l'anglais,
que doit-on faire quand un texte français cite un texte anglais (ou
vice versa) ? Mais il y a une question préliminaire que j'aurais dû
me poser, c'est : comment se fait-il que l'anglais et le français se
soient retrouvés avec des conventions typographiques différentes, et
est-il justifiable ou souhaitable de maintenir cette distinction ?
Considérons une règle typographique comme la suivante : les
ponctuations doubles (point d'exclamation, point d'interrogation, deux
points, point-virgule) sont précédées d'une espace insécable, et, pour
être encore plus précis, cette espace insécable est fine
(généralement qualifiée de quart de cadratin) s'agissant de
toutes sauf les deux points[#]
pour lesquels elle est normale (i.e., justifiante). Cette règle
figure à l'entrée ponctuation du Lexique des règles
typographiques en usage à l'Imprimerie
Nationale[#2], et pour
une raison assez obscure, on tire généralement la conclusion que la
règle doit s'appliquer en fonction de la langue dans laquelle on
écrit plutôt que — ce qui serait tout aussi légitime
— l'imprimeur (et notamment sa nationalité). Prenons un
autre exemple : il est sous-entendu dans le paragraphe précédent que
le choix entre les guillemets français (« comme ça ») et les
guillemets anglais (“comme ça”) est fait en fonction de la langue dans
laquelle on s'exprimer (laissant de côté toute subtilité liée au
mélange de deux langues). Mais historiquement, c'est juste que les
éditeurs et imprimeurs français, qui se trouvaient imprimer des
ouvrages en français, utilisaient les guillemets en forme de
chevrons, et les éditeurs et imprimeurs anglais, qui se trouvaient
imprimer des ouvrages en anglais, utilisaient des guillemets en
forme de virgules surélevées. (D'ailleurs, historiquement, les
guillemets français viennent des guillemets anglais, déplacés plus bas
et stylisés par certaines polices de caractères.) Maintenant que
l'informatique nous permet de tous être imprimeurs virtuels, il n'est
pas du tout évident que nous devions suivre les conventions des
imprimeurs français pour écrire du français et des imprimeurs anglais
pour écrire l'anglais.
Voici quelques raisons de penser autrement. Je pourrais d'abord
évoquer le cas du latin[#3] :
il est couramment admis qu'il est légitime, quand on cite du latin,
de ne pas le faire
entièrement en majuscules, sans espace ni ponctuation, et en utilisant
la même lettre pour U et V, sous prétexte que les romains faisaient
comme ça. La question de savoir si le latin doit utiliser des
guillemets en forme de chevron ou en forme de virgule, ou comment on
doit espacer un point d'interrogation dans un texte latin, est
visiblement une question complètement stupide : pourquoi en serait-il
autrement sous prétexte que le texte est dans une langue vivante ? •
Personne ne soutiendra non plus que
les polices
didones doivent servir spécifiquement pour typographier du
français. Pendant des décennies, on a entretenu l'illusion, ou au
moins le
débat, sur le fait que l'allemand, comme quelques autres langues
germaniques, devait être écrit en une forme de « gothique »
(typiquement,
la Fraktur), et on
voyait des livres changer consciencieusement d'alphabet (ou de police,
selon la manière dont on voudra considérer la chose) quand ils
passaient de l'allemand à une autre langue… jusqu'au moment où on
s'est enfin rendu compte de l'absurdité de cet usage ; et certains des
arguments pour défendre l'idée que l'allemand doit être écrit en
Fraktur nous semblent maintenant à mourir de rire.
[Ajout : à ce sujet,
voir cette entrée ultérieure.]
S'il est stupide de changer de police de caractères, pour quelle
raison devrait-on changer de forme de guillemets ou d'espacement de
certaines ponctuations sous prétexte qu'on change de langue ?
Il y a toutes sortes d'autres usages considérés comme liés à la
langue qu'on peut chercher à reconsidérer. L'espagnol, par exemple,
utilise des ponctuations inversées pour marquer le début des phrases
ou propositions interrogatives et exclamatives : mais ¿ est-ce
l'espagnol qui le fait ou sont-ce les éditeurs et
imprimeurs espagnols qui le font ? — et surtout, si cette
convention aide à la compréhension de la structure du texte,
¿ pourquoi donc la réserver à une seule langue ? (Je ne prétends pas
qu'il n'y a pas de raison valable : si l'espagnol marque les phrases
interrogatives par la seule intonation, il est légitime de faire
figurer cette intonation, à l'écrit, de façon plus visible que dans
une langue où une structure grammaticale, comme une inversion du
sujet, rend visible le caractère interrogatif de la phrase. D'un
autre côté, le français, au moins le français parlé, marque volontiers
les interrogations par la seule intonation, et ¡ aucune langue que je
connais n'a de structure grammaticale spéciale pour les phrases
exclamatives !) On peut aussi s'interroger sur l'Opportunité, en
Allemand, de marquer chaque Nom par une Majuscule (j'aimerais bien
savoir comment cette Habitude est née), alors que des Langues tout à
fait proches, comme le Néerlandais, ne le font pas : si cette
Convention aide à la Compréhension écrite, pourquoi ne pas l'adopter
dans d'autres Langues, et si elle n'a aucun Intérêt, pourquoi la
perpétuer ? La frontière entre typographie, ponctuation, orthographe
et grammaire est toujours un peu incertaine : quand on m'affirme
péremptoirement que c'est la grammaire allemande qui exige
des majuscules aux noms communs, je demande selon quelle règle on
décide que cette question précise relève de la grammaire.
Questions d'habitude ? Certes, mais l'habitude d'écrire l'allemand
en Fraktur était aussi bien ancrée : les habitudes se changent, et
peut-être les premières polices sans empattement ont-elles choqué, ça
n'empêche pas qu'elles existent maintenant. Je pense qu'il serait
intéressant de faire des expériences en la matière : pour chacune de
ces conventions typographiques (forme des guillemets, espacement
autour des ponctuations, utilisation de ponctuations inversées,
utilisation de majuscules à chaque nom, utilisation de majuscules tout
court), faire lire des textes en variant la convention, et ce, dans
différentes langues, et mesurer si la convention apporte effectivement
une différence mesurable dans l'efficacité de la lecture (temps de
lecture, niveau de compréhension), ou dans l'appréciation subjective
de la qualité du texte (on ne précisera pas, bien sûr, quel est le
paramètre testé). Autant je veux bien croire que l'allemand écrit
sans majuscules à chaque nom soit véritablement déstabilisant pour un
germanophone et ralentisse la compréhension, autant j'ai beaucoup plus
de mal à le croire s'agissant de la forme des guillemets dans une
langue quelconque (même, s'agissant de l'allemand, s'il s'agit
carrément d'une inversion du sens dans lequel ils pointent).
[#] Pourquoi diable les
deux points auraient-ils droit à un espacement différent du
point-virgule, d'ailleurs, voilà quelque chose dont je ne comprends ni
la cohérence ni l'élégance. Si j'avais un peu de courage,
j'essayerais de retrouver quelle est l'origine historique précise de
cette subtilité-là.
[#2] (Radotage.) J'ai
déjà dû exprimer à plusieurs reprises sur ce blog mon étonnement que
cet ouvrage confus, mal écrit, mal organisé, et parfois carrément
incohérent, soit si souvent érigé en bible de la typographie
française. C'est d'autant plus étonnant que le Lexique
lui-même ne prétend pas être chose qu'une convention interne
à l'Imprimerie nationale (et même pas toute l'Imprimerie nationale
puisque j'ai déjà souligné que le Journal Officiel, lui,
n'utilise pas d'accents sur les majuscules).
[#3] Encore plus
bizarre que le cas du latin est celui
du grec : le grec ancien, bien sûr, n'avait pas de ponctuation, mais
dès le 8e siècle, un point d'interrogation est apparu en grec qui, par
malchance, est graphiquement identique au point-virgule des langues
s'écrivant avec l'alphabet latin. Ce point d'interrogation est resté
en grec moderne (ce qui ne l'a pas empêché d'importer le point
d'exclamation « standard »). Unicode identifie canoniquement les deux
caractères (U+003F QUESTION MARK
et U+037E GREEK QUESTION MARK).
Pour l'équivalent du point-virgule (et, en transcription moderne du
grec ancien, des deux points), on utilise parfois un point
intermédiaire, c'est-à-dire à l'emplacement du point supérieur des
deux points (en Unicode, U+0387 GREEK ANO
TELEIA, unifié canoniquement
avec U+00B7 MIDDLE DOT). Bref,
c'est un peu le bordel. Mais au moins le grec a-t-il une excuse pour
avoir une ponctuation différente, c'est qu'il a un système d'écriture
différent : et si on voit mal pourquoi la ponctuation devrait changer
selon la langue, il est déjà plus compréhensible qu'elle
varie selon le système d'écriture : si on transcrit du grec
en alphabet latin, on va sans doute utiliser le point d'interrogation
« standard ». (Ceci étant, je pense que si j'écrivais en grec,
j'aurais tendance à l'importer dans cet alphabet aussi, par cohérence
avec le point d'exclamation.)
⁂
Il y a d'autres choses qui sont parfois considérées comme dépendant
de la langue et dont on peut s'interroger sur la pertinence. Le choix
du séparateur décimal, par exemple (entre un point et une virgule) :
en fait, il y a aussi le séparateur des milliers, mais
l'ISO
a mis son poing sur la
table et décidé — fort à raison — qu'on ne doit pas utiliser autre
chose qu'une éventuelle espace fine comme séparateur des milliers.
(Je ne vais pas non plus m'étendre sur les choses
comme le format des dates, ce
serait digresser un peu loin de mon sujet.) Pour ce qui est du
séparateur décimal, en revanche, l'ISO a tergiversé
et fini par admettre que le point et la virgule sont tous les deux
admissibles : personnellement, j'utilise systématiquement le point
quand je tape des nombres dans un ordinateur (parce que ça simplifie
le copier-coller dans plein de langages de programmation), et
systématiquement la virgule quand j'écris à la main (parce que le
point a tendance à disparaître), et je pense que c'est de loin la
convention la plus raisonnable, alors que je ne vois vraiment pas le
sens qu'il y aurait à écrire 1,25 sous prétexte que j'écris en
français, ou 1.25 sous prétexte que j'écris en anglais — un
nombre, c'est un nombre, c'est justement censé être universel.
Au rayon des nombres, on peut noter la convention sur l'écriture
des unités monétaires : la convention aux États-Unis est fermement
d'écrire $20 pour vingt dollars, et pas 20$, et il en va
de même au Royaume-Uni où on écrit £20 pour vingt livres et
pas 20£ ; maintenant, la question à 42¤, ou peut-être ¤42,
c'est de savoir si cette convention est une convention américaine
et britannique, une convention de la langue anglaise ou
une convention concernant le dollar et la livre. Après tout,
on écrit 20¢ pour vingt cents aux États-Unis, et 20p
pour vingt pence au Royaume-Uni (et avant la décimalisation, on
écrivait 1/8d ou 1s8d pour un shilling et huit pence),
ce qui suggère que la convention n'est pas liée uniquement à la langue
mais à l'unité considérée ; mais les Québecois écrivent 20$ (et
ce n'est pas parce qu'il s'agit du dollar canadien !). J'utilise
généralement les codes ISO 4217 pour les unités
monétaires (ça évite de se demander si ‘$’ fait référence
au USD ou au CAD ou au AUD ou
au NZD ou je ne sais quoi encore ; mais j'ai quand même
souvent la faiblesse d'écrire ‘€’ au lieu de EUR) : mais même
pour ces codes ISO 4217, personne n'a l'air de
savoir si on doit les mettre devant ou derrière le nombre et dans
quelles circonstances (l'Union européenne semble mettre devant le
nombre en anglais et derrière dans les autres langues, mais je n'ai
pas vérifié de façon très systématique).
Je pourrais aussi parler de la façon d'écrire les chiffres comme
‘1’ (avec ou sans barre ?), ‘7’ (avec ou sans barre médiane ?), ‘4’
(fermé ou pas ?), en écriture manuscrite, mais là, je pense qu'à peu
près tout le monde sera d'accord sur le fait qu'il s'agit d'une
différence géographique entre écritures et pas une convention liée à
telle ou telle langue. Je vais donc m'arrêter là. Faites-moi penser
une autre fois à parler aux majuscules cursives qui diffèrent d'un
endroit à un autre, parce que j'ai toutes sortes de choses à raconter
sur la forme des alphabets majuscule/minuscule, droit/italique/cursif
latin/grec/cyrillique (donc dix-huit combinaisons à comparer).
Et puis je comptais aussi en profiter pour
digresser sur l'importations d'anglicismes (de vocabulaire et de
syntaxe) en français, au nom du principe général de l'interlinguisme,
mais je pense que je vais garder ça aussi pour une autre fois.
Pour changer un peu des maths (et de la physique), j'ai envie —
sans avoir la prétention de faire de la linguistique sérieuse — de
parler de deux lettres/sons qui n'ont pas d'équivalent en français ou
en anglais (on peut arguër que le premier en a en allemand), mais qui
font partie du répertoire normal de langues sémitiques comme l'arabe ;
deux sons que les francophones ont souvent du mal à identifier ou à
distinguer, et même quand ils en ont entendu parler ils ont tendance à
les confondre. Je vais les appeler le ʔalif et le ʕayn,
même si je ne veux pas seulement parler des lettres arabes portant ces
noms (d'ailleurs, le ʔalif dont je parle correspond plutôt à la
hamzaẗ arabe, comme je vais le dire) : les noms phonétiques précis
sont occlusive laryngale sourde (ʔ) et constrictive/spirante
pharyngale sonore (ʕ), mais c'est un peu long à dire, pas
forcément tellement plus parlant pour le profane, et peut-être trop
distinctif (je ne veux pas vraiment distinguer la variante du ʕayn qui
est une vraie constrictive de celle qui est une spirante). Pour ceux
qui auraient des polices de caractères peu complètes, le caractère ‘ʔ’
est une sorte de point d'interrogation sans le point, tandis que le
‘ʕ’ est son symétrique gauche-droite (i.e., symétrique par rapport à
un axe vertical). Je vais expliquer plus bas d'où viennent ces
caractères.
Ces sons sont à la fois très différents et étrangement semblables.
Techniquement, bien qu'il s'agisse de deux consonnes, ils sont
différents sur toutes les dimensions phonétiques (occlusive contre
constrictive, laryngale contre pharyngale, sourde contre sonore), donc
il ne devrait y avoir aucun risque de confusion. Pourtant, il faut
reconnaître qu'il y a une certaine similarité, ou du moins un certain
parallélisme entre eux : les deux peuvent être perçus par ceux qui
ignorent leur existence comme une sorte de hiatus entre deux voyelles,
ils ont été comparés (à mon avis à tort) aux esprits doux et rude du
grec, et les Arabes ont eux-mêmes vu une certaine similitude
puisqu'ils écrivent le son ʔ (ayant réemployé pour autre chose la
lettre ʔalif qui le marquait historiquement) avec une lettre, la
hamzaẗ, qui est graphiquement dérivée du ʕayn.
Le son ʔ,
souvent appelé coup de glotte, peut être décrit tout simplement
comme une interruption de la voix. Il est donc très facile à
articuler, puisqu'il s'agit juste de séparer deux voyelles par du
silence, la principale difficulté étant de se rendre compte qu'il
s'agit bien d'une « consonne comme une autre ». Pour le prononcer, le
mieux est sans doute de dire une voyelle de façon prolongée (le ‘a’
étant probablement le mieux), et d'interrompre cette voyelle — en
interrompant le flux d'air — un peu soudainement, avant de la
reprendre, le tout sans jamais fermer la bouche. L'interruption se
fait en fermant les cordes vocales, situées au niveau de la partie du
larynx
appelée glotte
(à ne pas confondre avec
la luette,
le truc qui pendouille au fond de la gorge, et qui n'a rien à voir,
mais qui est parfois par erreur appelée glotte) : c'est pour
cette raison qu'on parle de consonne laryngale, ou glottale. Pour
ceux qui veulent un enregistrement (mais ce n'est sans doute pas très
éclairant), Wikipédia
a ça. Certains trouveront peut-être bizarre de qualifier cette
interruption de « consonne », mais le principe même d'une consonne
occlusive (ou au moins les occlusives sourdes : ‘p’, ‘t’, ‘k’, etc.)
est justement d'arrêter brièvement le son et le flux d'air de la
voix : ce qui distingue ces consonnes les unes des autres est la
manière dont l'interruption se fait (l'« attaque » de la consonne) et
la manière dont elle cesse (la « libération » de la consonne), seule
la dernière partie étant audible en début de mot/phrase et seule la
première étant audible en fin de mot/phrase ; le coup de glotte se
caractérise par le fait que l'attaque est faite par une fermeture, et
la libération par une réouverture, soudaines des cordes vocales.
Ceux qui connaissent l'allemand (et qui le prononcent
soigneusement) savent que dans cette langue, un mot ou même une partie
de mot composée commençant par une voyelle est prononcé articulé bien
séparément de ce qui précède : cette séparation est justement un coup
de glotte. Quand on prononce über alles, il ne
faut donc surtout pas lier le ‘r’ de la préposition avec le pronom qui
suit, mais bien dire ʔüber ʔalles. Certes, le
cas des mots isolés commençant par une voyelle n'est pas forcément le
plus convaincant (il y a un continuum entre une attaque « non
glottale », comme en français, où le souffle d'air commence très
légèrement avant que les cordes vocales entrent en vibration, et une
attaque « glottale », comme en allemand, où les deux sont
concomitants), mais si le coup de glotte est au milieu d'un mot, on
peut plus facilement se convaincre qu'il s'agit bien d'un son
autonome : penser au mot beachten,
prononcé beʔachten, bien détaché, sans qu'il y
ait transition graduelle d'une voyelle à l'autre.
Les exemples en anglais ou français sont plus difficiles à donner.
En anglais, cependant, quand on prononce
l'interjection uh-oh!, elle est généralement
rendue comme ʔuh-ʔoh!, ou en alphabet phonétique
correct, [ˈʔʌˈʔəʊ] — je ne sais pas vraiment ce qui explique la
spécificité de cette interjection. Certains Anglais, notamment les
Londoniens, et dans certains contextes les Américains aussi, ont
tendance, surtout quand ils parlent vite, à remplacer certaines
consonnes par des coups de glotte (par
exemple, button est prononcé par certains avec un
‘ʔ’ à la place du ‘t’, et le ‘on’ étant par ailleurs transformé en un
‘n’ syllabique : [ˈbʌʔn̩]), mais c'est le genre de phénomène qui a
tendance à passer complètement inaperçu, y compris de ceux qui le
pratiquent. En français, je ne vois vraiment rien : les francophones
ont tendance à tout articuler d'un seul souffle, sans aimer
s'interrompre plus que nécessaire (on le voit aussi peut-être à
l'inexistence des consonnes géminées, c'est-à-dire des consonnes
« allongées » où l'intervalle de silence entre l'attaque et la
libération est prolongé, comme les consonnes redoublées de l'italien).
Même la ‘h’ dite « aspirée » en français, comme dans le hiatus
non seulement n'est pas aspirée, mais n'est même pas prononcée du
tout. Peut-être quand il y a hiatus entre deux voyelles identiques
(à Alger) a-t-on tendance à les séparer par un léger coup de
glotte, mais même dans ce cas il me semble qu'il est optionnel et/ou
peu marqué. En revanche, dans d'autres langues, le ʔ peut être une
consonne tout à fait normale : je vais reparler des langues
sémitiques, mais pour l'anecdote on peut signaler que Hawaï
devrait être prononcé Hawaiʔi (dans ce contexte de
transcription des langues polynésiennes, le ‘ʔ’ est généralement noté
par une apostrophe inversée, donc quelque chose comme Hawai`i —
je trouve ça assez mauvais parce que ça encourage à la confusion avec
le ‘ʕ’ dont je dois encore parler et qui est souvent aussi noté comme
ça). On peut tout à fait géminer (i.e., redoubler) un ‘ʔ’, ce qui
revient à faire une interruption plus longue.
Le son ʕ
est peut-être plus subtil à décrire, et il y a aussi plus de
variabilité possible (si on est soigneux, on peut distinguer
une constrictive [=fricative] pharyngale sonore
d'une spirante [=constrictive ouverte] pharyngale sonore,
selon le niveau de resserrement du pharynx ; par ailleurs, j'ai lu des
gens expliquant que, au moins dans certaines prononciations de
l'arabe, la lettre ʕayn dont la prononciation « canonique » devrait
sans doute être le son dont je parle ici, serait plutôt rendue comme
un coup de glotte pharyngalisé, noté [ʔˤ], donc une sorte de mélange
des deux sons dont je parle, ce qui commence à devenir franchement
subtil ; de même, on confond souvent les pharyngales avec les
épiglottales ou épiglotto-pharyngales, et j'avoue ne jamais avoir
réussi à me convaincre de la différence). À nouveau, vous avez
un enregistrement
sur Wikipédia, mais je ne sais pas s'il permettra vraiment de
comprendre comment le son fonctionne.
Cette fois-ci, il s'agit d'un son prononcé avec le pharynx,
c'est-à-dire l'arrière de la gorge, en reculant l'arrière de la langue
vers l'arrière de la gorge de façon à y restreindre le passage de
l'air (on peut aussi le faire avec l'épiglotte, mais comme je le
disais, la distinction ne me semble pas claire). Ce son n'est pas
difficile à prononcer, mais il n'est pas vraiment facile à expliquer
si je m'adresse à des francophones vu qu'il n'y a aucune sorte de
consonne pharyngale en français : quand on dit un son prononcé avec
l'arrière de la gorge, les gens ont tendance à émettre un râle
inarticulé qui ressemble à une caricature de ce qu'ils imaginent être
l'arabe, or le ʕayn est un son au contraire assez doux.
Il faut dire que ça n'aide pas que la phonétique
parle de consonnes « sourdes » et « sonores » pour désigner celles qui
sont articulées sans vibration des cordes vocales (comme ‘t’, ‘p’,
‘f’, ‘k’) et celles qui sont articulées avec (comme ‘d’, ‘b’, ‘v’,
‘g’), alors que les sourdes ont tendance à être prononcées plus
fortes que les sonores, vu que le fait de faire vibrer les cordes
vocales (pour prononcer une sonore) empêche que le flux d'air soit
trop important (ce qui donne un son plus fort). C'est ainsi que le
son ‘h’ le plus courant (celui de l'anglais et de l'allemand, entre
autres langues ; il s'agit d'une laryngale) est sourd, mais que sa
variante sonore (qui est plus courante en néerlandais, par exemple),
‘ɦ’, est relativement inaudible. La contrepartie sourde du ʕayn,
c'est-à-dire le ‘ħ’ (ou « ‘h’ pharyngal »), est donc prononcée
beaucoup plus forte, et c'est sans doute à ce son-là que les gens
pensent quand on évoque une consonne pharyngale : c'est un son qui
apparaît dans un certain nombre de mots arabes connus
(comme halal ou le Hamas ; il est typiquement transcrit
‘ḥ’, mais je préfère ici le ‘ħ’ de l'alphabet phonétique). Ce ‘ħ’
(enregistrement
ici) est approximativement quelque chose d'intermédiaire entre le
‘ch’ dur de l'allemand (dans Bach, par exemple,
phonétiquement [x] ou plutôt [χ]) et le ‘h’ de l'anglais ou de
l'allemand : en gros, il s'agit d'arriver à produire une turbulence
comme pour le premier, mais sans l'aide du palais (ce qui se
confirmera au fait qu'on arrive à le prononcer avec la bouche
complètement ouverte, la luette étant bien visible dans un miroir).
Je répète que si le ‘ħ’ et le ‘ʕ’ (ʕayn) ont le même lieu
d'articulation (pharyngal), comme le ʕayn est « sonore », il est
en fait beaucoup plus doux.
Pour prononcer le ʕayn, je propose plutôt aux francophones de
penser à l'‘r’ française dans sa forme atténuée, peut-être dans le
mot parti, et d'essayer de prononcer quelque chose
d'intermédiaire entre elle et un simple allongement de la voyelle ‘a’.
L'‘r’ française est uvulaire, c'est-à-dire que ce son est prononcé en
approchant la langue de la luette (« le truc qui pend à l'arrière de
la gorge »), soit pour produire un battement (mais cette ‘r’
« roulée » est une prononciation assez marginale et ce n'est pas celle
qu'on recherche ici), soit pour produire un frottement, plus ou moins
atténué. Il s'agit maintenant de prononcer le même genre de
frottement atténué mais avec l'arrière de la langue, à peu près à
l'emplacement où elle est déjà pour prononcer la voyelle ‘a’. Ce qui
explique que certains analysent le [ʕ] comme un « [ɑ] consonne » à la
manière dont le [w] est un « [u] (c'est-à-dire ‘ou’ français)
consonne », le [j] (c'est-à-dire le ‘-ille’ français comme
dans feuille) est un « [i] consonne », et le [ɥ] (comme le ‘u’
du mot français nuit prononcé par un non-Belge) est un « [y]
(c'est-à-dire le ‘u’ français) consonne ». D'ailleurs, le mot arabe
ʕīd (عيد), qui signifie fête, a été
tranformé par les Français en Aïd, ce ‘a’ initial étant juste
une façon de noter le ʕayn initial (et c'est vrai que c'est un peu
difficile de prononcer ‘ʕi’ sans faire une sorte de ‘a’ quelque part,
quand la langue passe de la position arrière nécessaire au ‘ʕ’ à la
position avant nécessaire au ‘i’). Mais dans ma tête, le ʕayn fait
surtout penser à une sorte de ‘r’-du-français un peu avalé (et je
crois que ma mémoire les classe ensemble, si bien que j'ai tendance à
mélanger le ‘ʕ’ et le ‘r’ même si dans une langue comme l'arabe il n'y
a vraiment pas de ressemblance entre eux).
Ci-dessus j'ai seulement parlé des sons, il faut
maintenant dire aussi quelque chose des lettres et de leur
transcription. Dans les langues sémitiques, ou plus généralement
chamito-sémitiques (=afro-asiatiques), a priori, à la fois le
‘ʔ’ et le ‘ʕ’ sont des lettres (consonnes) à part entière, ce qui
explique que je les aie appelées ʔalif et ʕayn, d'après les noms
arabes des lettres en principe correspondantes ; mais il y a des
subtilités. En égyptien hiéroglyphique, le ʔalif est le hiéroglyphe
𓄿
(G1,
vautour égyptien, plus exactement
un percnoptère) ;
pour éviter d'avoir à dessiner un vautour, les égyptologue utilisent
une transcription spéciale, ‘ꜣ’ (en
Unicode, U+A723 LATIN SMALL LETTER
EGYPTOLOGICAL ALEF), une sorte de ‘3’ évoquant vaguement le
dessin du vautour. Le ʕayn, lui, est 𓂝 (D36, bras — tiens, il
n'a pas d'entrée sur Wikipédia, celui-là ?), qui a aussi sa
transcription spéciale, ‘ꜥ’ (U+A725 LATIN
SMALL LETTER EGYPTOLOGICAL AIN), une sorte d'angle pas très net
vaguement comme un ‘r’ minuscule (je ne sais pas d'où vient ce
symbole). Comme on ne connaît pas les voyelles de l'égyptien (seules
les consonnes étaient notées), il est parfois tentant d'inférer un ‘a’
pour l'une ou l'autre de ces lettres : par exemple, le hiéroglyphe
sans doute le plus célèbre,
la croix ansée (en
fait peut-être un nœud de sandale) ou symbole de la vie, très apprécié
des occultistes, a la valeur phonétique ꜥnḫ, et on rend souvent
ça par ankh. Maintenant, comme je n'aime pas trop les symboles
‘ꜣ’ et ‘ꜥ’, je vais préférer ‘ʔ’ et ‘ʕ’ (on n'est pas certain, bien
sûr, que ces hiéroglyphes correspondent exactement aux sons que j'ai
décrits ci-dessus, mais c'est au moins une hypothèse plausible ou une
approximation).
En arabe, la lettre qui servait à l'origine (probablement !) à
désigner le son ‘ʔ’, et par laquelle j'ai choisi de le désigner,
ʔalif, a dévié vers un autre usage, celui d'allonger la voyelle ‘a’
(il faut préciser que l'arabe utiliser des consonnes pour marquer
l'allongement des voyelles : la voyelle longue ‘ī’ est notée ‘{i}y’,
la voyelle longue ‘ū’ est notée ‘{u}w’, et la voyelle longue ‘ā’ est
notée par un ‘{a}’ suivi d'un ʔalif, justement ; dans tous les cas,
j'écris la voyelle entre accolades parce que les voyelles ne sont
normalement pas écrites en arabe, donc seule reste visible la consonne
d'allongement). Il n'y a qu'en début de mot que le ʔalif a gardé son
rôle de noter le son ‘ʔ’, i.e., le coup de glotte. Mais comme le coup
de glotte reste en tant que consonne du langage, une autre lettre a
été introduite pour le
noter, la hamzaẗ, qui
obéit à des règles orthographiques un peu compliquées (la hamzaẗ
est généralement « portée » par une autre consonne, ‘y’, ‘w’ ou
justement le ʔalif, et ce n'est que dans des cas spéciaux qu'elle peut
apparaître en tant que lettre autonome) : du coup, ce n'est pas très
clair si le caractère ‘ʔ’ (ou variante) doit servir à transcrire le
ʔalif, la hamzaẗ, ou la combinaison des deux (la combinaison des deux
est fréquente en début de mot, où le ʔalif historique a été orné d'une
hamzaẗ — au-dessus ou en-dessous selon la voyelle — pour faire bon
poids lorsqu'il s'agit de marquer les mots qui commencent par le
son ‘ʔ’, c'est-à-dire « par une voyelle »). Pour compliquer les
choses, le symbole de la hamzaẗ (ء) est dérivé de celui du
ʕayn (ع).
Il n'y a jamais en arabe deux voyelles qui se suivent
immédiatement. Lorsque la transcription le laisse croire, il peut
s'agir d'une diphtongue (‘{a}y’ ou ‘{a}w’ donc en fait
voyelle+consonne), ou bien qu'il y ait entre ces deux voyelles une
consonne qui « ne se transcrit pas », donc justement la hamzaẗ pour le
son ‘ʔ’ ou le ʕayn pour le son ‘ʕ’. Par exemple, le
prénom Saïd est, en fait, Saʕīd
(سعيد) ; et l'expression si Dieu le veut
(إن شاء الله) est in šāʔa (ʔa)llāh. Il en
va de même des voyelles qui semblent débuter un mot : si on n'a rien
transcrit, c'est en fait que le mot commence par ʔalif+hamzaẗ ou bien
par ʕayn. D'ailleurs, le mot arabe lui-même vient
de ʕarabīy, le mot émir (commandant, prince)
est ʔamīr, l'Iraq est ʕirāq et un imam est
un ʔimām. Allez savoir, d'ailleurs, pourquoi ʕīd est
devenu Aïd en français, mais ʕirāq est
devenu Ira(q|k) et pas Aïrak selon la même logique.
(Quant au mot Allah ou à l'article défini al-, il
commence par ʔalif+hamzaẗ, avec la subtilité cependant que la hamzaẗ
est ici « instable », c'est-à-dire que la voyelle tombera après un mot
terminé par une voyelle — un peu comme l'élision de le
en l' en français, mais à l'envers.)
À cause de ce fait qu'une « voyelle initiale » dans un mot arabe
doit être précédée d'un ‘ʔ’ ou d'un ‘ʕ’ (analyse douteuse : ce sont
juste des consonnes comme les autres), certains grammairiens ont voulu
comparer ces situations aux « esprits » du grec ancien, qui marquent
si un mot commençant par une voyelle commence vraiment par la voyelle
(esprit doux, marqué par un ‘ʾ’ sur la voyelle) ou commence en fait
par une aspiration, c'est-à-dire un [h] (esprit rude, marqué par un
‘ʿ’ sur la voyelle). La comparaison est très douteuse pour plusieurs
raisons : les esprits du grec n'ont de sens que en début de
mot, alors que la hamzaẗ et le ʕayn de l'arabe sont des consonnes tout
à fait normales, et les sons ne sont pas les mêmes (on ne sait pas si
l'esprit doux était prononcé comme un ‘ʔ’ ou pas prononcé du tout,
mais l'esprit rude n'était très certainement pas un [ʕ], on est à peu
près sûr que c'était un [h]). Néanmoins, à cause de cette analogie,
on note parfois ‘ʾ’ (U+02BE MODIFIER LETTER
RIGHT HALF RING) et ‘ʿ’ (U+02BF
MODIFIER LETTER LEFT HALF RING) ce que j'ai noté respectivement
‘ʔ’ (U+0294 LATIN LETTER GLOTTAL
STOP) et ‘ʕ’ (U+0295 LATIN LETTER
PHARYNGEAL VOICED FRICATIVE). Là aussi, la confusion existe
pour savoir si, en arabe, ‘ʾ’ doit servir à transcrire le ʔalif (ce
qui est historiquement justifié), la hamzaẗ (ce qui est phonétiquement
justifié), ou la combinaison des deux (et différents systèmes de
transcription ont choisi différentes solutions). Je suppose, même si
je n'en ai pas de confirmation claire, que les caractères ‘ʔ’ et ‘ʕ’
ont été inventés par les phonéticiens qui ont créé l'alphabet
phonétique international sur la base des ‘ʾ’ et ‘ʿ’ eux-mêmes dérivés
des dessins des esprits grecs.
Par ailleurs, il faut signaler que l'arabe a des
consonnes dites « emphatiques », c'est-à-dire pharyngalisées : ṣ (ص),
ḍ (ض), ṭ (ط), et le relativement rare ẓ (ظ), qui sont prononcés un
peu mais pas exactement comme si la lettre non-emphatique
correspondante était suivie d'un petit ʕayn. (Un peu à la manière
dont le ‘gn’ français, ou ‘n’ « mouillé », est un peu comme
un ‘n’ suivi d'un [j] et le ‘gli’ italien ou ‘l’ « mouillé » —
dans famiglia par exemple — est un peu
comme un ‘l’ suivi d'un [j] : en fait, cette « mouillure » est
une palatalisation, ou articulation secondaire d'un [j] par
rapprochement de la langue du palais, et la pharyngalisation est, de
même, un rapprochement de l'arrière de la langue vers l'arrière de la
gorge comme quand on prononce [ʕ].) En phonétique, on note ça [sˤ],
[dˤ], etc. (avec un ‘ʕ’ en exposant). Je ne sais pas, d'ailleurs, si
ces consonnes emphatiques viennent ou non d'une combinaison consonne +
ʕayn.
Toujours est-il que je déteste les transcriptions qui font purement
et simplement disparaître ces consonnes essentielles : je sais que
j'ai déjà ranté à ce sujet, mais il
me semble essentiel de ne pas massacrer les mots étrangers (surtout
quand ils sont relativement peu acclimatés au français, c'est-à-dire
pas encore totalement importés/naturalisés). Surtout que si on
utilise la transcription par ‘ʾ’ et ‘ʿ’, les gens qui ignorent la
langue vont de toute façon sauter ces signes et ne pas être gênés par
eux (les ‘ʔ’ et ‘ʕ’ peuvent être plus gênants, je ne les utilise ici
que parce que je ne parle pas que de l'arabe mais aussi de leur
phonétique).
Quant à l'hébreu, il a bien les deux lettres ʔalif (enfin, en
hébreu, ʔalef), א, et ʕayn (ʕayin), ע : apparemment, à l'époque
biblique, elles pouvaient bien être prononcées [ʔ] et [ʕ], mais il y a
une subtilité, c'est qu'elles représentent chacune la fusion de deux
lettres proto-sémitiques (restées distinctes en arabe), à savoir les
pharygo-laryngales que j'ai décrites, et des analogues uvulaires, [χ]
(le ‘ch’ dur de l'allemand, dans Bach, par
exemple, ou le ‘ẖ’/خ arabe) et [ʁ] (en gros le ‘r’ standard du
français, ou le ‘ġ’/غ arabe), et donc les deux prononciations étaient
possibles pour chacune des deux lettres ([ʔ] ou [χ] pour ʔalef, et [ʕ]
ou [ʁ] pour ʕayin). La prononciation moderne de l'hébreu est
relativement artificielle puisqu'elle résulte d'une synthèse de
différentes traditions sur la façon de prononcer l'hébreu biblique, et
comme les héritiers de certaines de ces traditions parlaient des
langues très éloignées (par exemple le yiddish, qui est germanique),
il n'est pas surprenant que la prononciation s'en soit ressentie : je
crois comprendre que la plupart des locuteurs, au moins d'accent
« non-oriental », de l'hébreu moderne prononcent ʔalef et ʕayin de la
même façon — comme un coup de glotte, voire, pas du tout.
Je mentionnais récemment la
difficulté à apprendre au cerveau à séparer les langues étrangères, et
spécifiquement l'exemple, dans mon cas, du néerlandais et du suédois.
Complètement par hasard, je suis tombé sur un exemple intéressant sous
la forme de ce
court-métrage
(fiche ici
sur IMDB), que j'avais bookmarké et que j'ai regardé
pour passer le temps pendant qu'il fait trop chaud pour sortir.
Le court-métrage en lui-même n'est pas franchement intéressant, la
seule chose qui fait que je le
mentionne[#], c'est qu'il est en
néerlandais, en suédois et en anglais (mais bon, comme il doit y avoir
15 répliques en tout, ça fait environ 5 répliques dans chaque langue,
ce n'est pas énorme). Le truc, c'est qu'en regardant juste le titre
donné par YouTube (vattnet, c'est du suédois,
et water, j'ai compris ça — à raison — comme la
traduction anglaise du titre, mais je n'ai pas spécialement pensé que
c'était aussi du néerlandais), je m'attendais à ce que ce
soit en suédois, avec pour raison de plus que le premier personnage
qu'on voit (et qui est en fait néerlandais) a un drapeau suédois dans
sa chambre. Du coup j'ai cherché à comprendre les premières répliques
comme du suédois, et j'étais surpris de ne comprendre absolument
rien, même avec les sous-titres. Puis un personnage suédois
apparaît, et demande vem är du? (qui
es-tu ?) à l'autre, et là j'ai évidemment compris, mais le
néerlandais répond I don't understand, et là j'ai
saisi que c'était de l'anglais, mais j'étais totalement embrouillé
quant à la raison pour laquelle il prétendait ne pas comprendre. Ce
n'est que quand j'ai vu un panneau avec
l'indication verboden toegang que mon cerveau a
enfin tilté. Et ce qui est intéressant, c'est qu'à ce moment-là les
répliques suivantes en néerlandais sont devenues parfaitement
compréhensibles pour moi (je n'ai pas réécouté le début, mais je n'ai
aucune raison de penser que les premières répliques auraient été moins
bien articulées que les suivantes).
Bref, mon cerveau écoutant du néerlandais en s'attendant à entendre
du suédois ne comprend rien, alors qu'avec la bonne information de la
langue à comprendre, y arrive. Ça n'a rien de spécialement
surprenant, mais c'était vraiment frappant. Et en quelque sorte,
c'est une bonne nouvelle, parce que ça veut dire que j'ai
effectivement créé deux catégories mentales bien distinctes,
pour le néerlandais et le suédois (après, peut-être que ce
court-métrage m'a totalement embrouillé et que c'était une grave
erreur que de le regarder…).
J'avais eu un exemple vaguement semblable, mais moins frappant, en
tombant par hasard à la télé sur une série historique diffusée sur
Arte sur la guerre prusso-danoise de 1864, série qui était à moitié en
allemand et à moitié en danois : n'ayant pas regardé le résumé, je
n'en avais aucune idée, et ayant d'abord entendu et compris de
l'allemand, j'ai été très surpris ensuite d'entendre du danois et de
n'y comprendre absolument rien, alors que je pensais que c'était
encore de l'allemand, prononcé avec un accent à couper au couteau.
Certes, il est assez normal que je ne comprenne pas le danois, mais
une fois que j'ai lu le résumé, appris qu'il s'agissait de danois, et
mis les sous-titres, j'ai au moins pu comprendre un certain nombre de
phrases simples. • Encore un autre exemple est fourni
par cette
musique (que j'aime d'ailleurs énormément sur le plan musical,
mais c'est parce que j'ai notoirement des goûts de chiottes) : je
pensais que les paroles étaient dans une langue
inventée[#2]. Et après l'avoir
écouté je ne sais combien de
fois[#3], mon cerveau a
capté du kan om du vil, ce qui est du bon suédois
(tu peux si tu veux) ; après, en fait, il s'avère que ce n'est
pas du suédois, c'est du norvégien (bokmål), mais on voit l'idée.
Ceci étant, les paroles des chansons, en général, même quand c'est
dans une langue que je comprends parfaitement, je n'y capte rien du
tout, et je ne suis pas le seul
apparemment. Bref.
[Note pour moi-même : il y a deux choses qui me viennent à l'esprit
au sujet de l'apprentissage des langues et qu'il faut que je raconte
dans des entrées ultérieures : la difficulté à se créer une catégorie
mentale pour un phonème (même si on arrive parfaitement bien
à le prononcer et à le reconnaître prononcé, ce qui sont des choses
différentes), et la difficulté à se former une
mémoire automatique pour appliquer les sortes de fonctions
booléennes qui sont utilisées par les règles grammaticales.]
[#] Et que je ne le
recommanderais qu'à quelqu'un qui est dans la même situation que moi,
i.e., qui comprend juste un petit peu le néerlandais et le suédois,
chose qui n'est probablement pas très fréquente parmi les lecteurs de
blogs en français, donc je serais, en vérité, un peu surpris
d'apprendre que j'ai ne serait-ce qu'un lecteur dans ce cas.
[#2] Ce n'est pas
rare !, s'agissant de ce genre de musique. Je l'ai appris après avoir
vainement cherché à comprendre le « latin »
de Conquest
of Paradise de Vangelis.
[#3] Dans une autre
version que celle vers laquelle je pointe sur YouTube, bien sûr : si
j'avais vu les paroles écrites, bien sûr, je n'aurais pas eu de mal à
comprendre.
En tant qu'aspirant polyglotte amateur, je trouve fascinante la
question de savoir comment le cerveau crée des contextes mentaux pour
des langues différentes. La séparation entre ces contextes varie
d'ailleurs fortement d'une personne à une autre : je connais des gens
polyglottes qui arrivent à passer sans aucune transition d'une langue
à une autre ou à les mélanger, et d'autres — c'est un peu mon cas —
pour qui ceci demande un certain effort
de changement de contexte, et qui
ont, du coup, une certaine difficulté à traduire, même entre
des langues dont ils ont par ailleurs une excellente maîtrise. Je
connais des gens qui préfèrent utiliser une certaine langue pour
certaines sortes de conversations ou de pensées, ou qui prétendent ne
pas avoir tout à fait la même personnalité dans telle langue que dans
telle autre (je pense que c'est exagéré ; en revanche, il est vrai que
les gens peuvent avoir une voix étonnamment différente dans des
langues différentes).
Apparemment, il
n'y a pas une région différente du cerveau par langue : ceci rend
d'autant plus fascinante la façon dont fonctionne cette
séparation.
Un exemple que je trouve assez frappant de l'existence de ces
« contextes » linguistiques est le suivant : il m'est arrivé
d'entendre quelqu'un parler une langue qui n'est pas celle que
j'attendais, et de ne rien comprendre avant de me rendre compte de la
langue qui était parlée. Notamment, il m'est arrivé de ne pas
comprendre des gens qui étaient en train de parler français,
simplement parce j'étais persuadé qu'ils parlaient une autre langue et
mon cerveau n'analysait pas les sons comme du français — je n'étais
pas dans le bon contexte.
Et si ces contextes mentaux existent, il faut commencer par les
créer. C'est-à-dire, en démarrant l'apprentissage d'une nouvelle
langue, convaincre le cerveau qu'il va falloir créer un nouveau
contexte, à séparer de ceux qui existent déjà. Si la langue est très
différente, ça ne devrait pas être trop difficile (l'apprentissage
lui-même sera d'autant plus ardu, bien sûr, mais au moins on risque
moins de s'embrouiller). Mais si on commence à apprendre une langue
proche d'une autre qu'on connaît déjà, ou, pire, de deux langues
proches simultanément, il faut trouver des moyens de se créer des
barrières mentales entre ces langues. Sans pour autant s'interdire
d'utiliser la proximité des deux langues pour extrapoler du
vocabulaire qu'on ne connaît pas (au moins en compréhension).
Je suis notamment confronté à cette situation entre le néerlandais
et le suédois, deux langues dont j'ai une connaissance tout à fait
rudimentaire, et dans une moindre mesure, entre l'allemand (que je
parle mal mais que je comprends passablement bien) et le néerlandais.
Ce qui pousse à la confusion n'est cependant pas toujours ce qu'on
imagine : par exemple, le mot néerlandais wie,
signifiant qui (le pronom interrogatif) ait exactement la même
écriture et une prononciation très proche, du mot
allemand wie, lequel signifie comment
(l'adverbe interrogatif), ne m'a pas semblé source de confusion. Mais
comparons les deux phrases suivantes, que j'écris d'abord en
néerlandais, puis en allemand, puis en anglais, pour mieux rendre
apparentes les similarités :
Is het de vrouw die ik heb gezien? Nee, het is de
man die je hebt gezien.
Ist es die Frau, die ich gesehen habe? Nein, es ist
der Mann, den du gesehen hast.
Is it the woman that I have seen? No, it is the man
that you have seen.
(Soit en français : Est-ce la femme que j'ai vue ? Non, c'est
l'homme que tu as vu. L'emploi du parfait plutôt que du prétérit
est sans doute moins naturel en anglais que dans les deux langues
précédentes, et on aurait tendance à omettre le that, mais je
garde les choses pour maintenir le parallélisme.) Une première
observation est que l'ordre des deux derniers mots de chaque phrase
est inversé en allemand par rapport à ce qu'il est en néerlandais et
en anglais : la raison est qu'à la fois l'allemand et le néerlandais
mettent le verbe en position finale dans les subordonnées, mais quand
il y a plusieurs morceaux du verbe, l'allemand gère la priorité pour
la fin de la subordonnée comme une pile alors que le néerlandais la
gère comme une file, ce qui conduit à une inversion de l'auxiliaire et
du participe passé en allemand qui n'a pas lieu en néerlandais.
Bizarrement, ceci ne m'a demandé aucun effort particulier, je trouve
parfaitement naturel de passer de l'ordre de l'allemand à celui du
néerlandais ou vice versa. (À cette seule exception près, les mots se
correspondent exactement, et doivent montrer de façon assez nette la
similarité de ces trois langues. J'aime bien dire que le néerlandais
est à peu près ce qu'aurait été l'anglais si les Normands n'avaient
pas conquis l'Angleterre en 1066.)
En revanche, ce qui me pose beaucoup de problème avec les phrases,
c'est le pronom relatif die dans la deuxième
phrase en néerlandais. En allemand, il y a trois genres : le
masculin, le féminin et le neutre ; die Frau est
féminin alors que der Mann est masculin, et le
pronom relatif est (en gros) le même que l'article défini (ici, on
a den dans la seconde phrase parce que c'est un
accusatif, mais peu importe). En néerlandais (comme, d'ailleurs, en
suédois), il n'y a que le neutre et le non-neutre (c'est-à-dire,
logiquement, l'utre, ou genre commun), et de
vrouw comme de man sont non-neutres ; le
pronom relatif (qui est d'ailleurs le même que le démonstratif)
est die au non-neutre. C'est donc la même forme
que le pronom relatif féminin en allemand : et quand j'entends la
deuxième phrase (ou simplement die man, =cet
homme-là), mon cerveau me crie qu'il y a un problème de genre.
Voici maintenant un problème entre le néerlandais et le suédois :
comme je viens de le dire, ces deux langues ont en commun d'avoir deux
genres, le neutre et le non-neutre. L'article indéfini non-neutre est
à peu près le même entre les deux langues : een
man en néerlandais signifie la même chose que en
man en suédois (d'ailleurs, la prononciation n'est pas très
éloignée non plus), c'est-à-dire un homme ; l'article défini
n'est pas du tout pareil (en suédois il est postposé, au moins tant
qu'il n'y a pas d'article), mais ce n'est pas très grave, ça ne cause
pas de confusion, en tout cas pas sur ce mot-là (de
man en néerlandais, mannen en suédois) —
d'ailleurs, s'il y a un adjectif, ça redevient très proche et toujours
peu confusant (l'homme fort se dit de sterk
man en néerlandais, den starke mannen en
suédois). Mais pour le neutre, il y a une chose qui est
particulièrement gênante pour mon cerveau, c'est que l'article
neutre indéfini en suédois, ett est
presque le même (au moins au niveau de la prononciation), que
l'article neutre défini en
néerlandais, het (le ‘h’ se prononce très peu vu
qu'il est sonore — oui, la terminologie des phonéticiens est
confusante elle aussi). Ainsi, het huis
signifie la maison en néerlandais,
mais ett hus signifie une maison
en suédois. (Si on veut dire une maison en néerlandais,
c'est een huis, l'article indéfini étant le même
pour les deux genres ; et si on veut dire la maison en suédois,
c'est huset.) J'ai mis un certain temps à me
rendre compte de pourquoi j'avais du mal à me forcer à penser
que ett hus signifie une maison
alors que je n'avais pas de mal pour en man, et
ce n'est qu'après une certaine réflexion que j'ai compris que c'était
ma (faible) connaissance du néerlandais qui bloquait mon cerveau.
Sur d'autres mots, je vais être gêné par le fait que l'article
défini postposé suédois -(e)n évoque très fort un pluriel allemand (le
pluriel suédois ayant plutôt tendance à être en -r pour ces mots).
Ceci ne se produit pas pour l'exemple mannen, en
revanche je peux prendre l'exemple de tidningen,
qui veut dire le journal en suédois et qui ressemblent beaucoup
— et le radical est cognat — à Zeitungen, qui
signifie des journaux en allemand. Comme les verbes en suédois
ne varient ni selon la personne ni selon le nombre du sujet, ça n'aide
pas à identifier l'erreur (et elle est d'autant plus tentante si le
verbe est är, le présent du verbe être à toutes
les personnes, qui a plus ou moins donné
l'anglais are, et qui fait donc aussi vibrer mes
neurones à pluriel, si j'ose dire).
D'autres confusions viennent de la prononciation, c'est-à-dire du
passage de l'écrit à l'oral : l'allemand et le néerlandais ont des
prononciations très régulières (il y a des langues encore plus
régulières en la matière, comme le hongrois, le finlandais ou le turc,
mais l'allemand et le néerlandais sont tout de même assez hauts,
surtout quand on les compare au français ou
— shudder — à
l'anglais) ; une des spécificités du néerlandais est que dans les
terminaisons -en (typiquement d'un infinitif ou d'un pluriel), le ‘n’
ne se prononce pas (je simplifie). Le suédois, lui, est beaucoup plus
irrégulier, avec des lettres finales qui ne se prononcent pas
(mais pas le ‘n’), un ‘r’ qui subit un phénomène un peu comme
en anglais anglais (je veux dire, en anglais d'Angleterre, où il tombe
devant les consonnes avec une modifications du contexte), un ‘o’ qui
peut se prononcer aléatoirement /oː/–/ɔ/ ou /uː/–/ʊ/ sans logique
apparente, etc. Qui plus est, le suédois a un système d'accent
tonique sérieusement différent de l'allemand et du néerlandais
(ceux-ci accentuent une syllabe par mot, en gros la première
à l'exception de quelques préfixes inaccentués, et en tout cas dans la
première partie des mots composés ; le suédois, lui, a très
fréquemment un accent secondaire, même dans des mots de deux syllabes,
et cet accent a une composante tonale/mélodique). Par ailleurs,
l'allemand, le néerlandais et le suédois n'ont pas les mêmes
phénomènes d'assimilation (en allemand, les sonores à la fin des mots
s'assourdissent, et il y a une assimilation régressive causée par les
affixes sourds : le verbe geben, =donner,
devient à la 3e presonne du singulier [er] gibt,
=il donne, où le ‘b’ est prononcé /p/ parce que le ‘t’ qui suit
est sourd ; en néerlandais, il y a également une assimilation dans les
mots composés, ou même entre deux mots d'une même phrase, qui peut
etre progressive ou régressive selon des règles que je ne comprends
pas bien, mais en gros les fricatives sont assimilées par les
occlusives : dans huisbezoek, =visite à
domicile, le ‘s’ est prononcé /z/, sonore à cause du ‘b’ sonore
qui suit, exemple d'assimilation régressive, alors que
dans diepzee, =mer profonde, le ‘z’ est
prononcé /s/, sourd à cause du ‘p’ sourd qui précède, et si les deux
sont des occlusives, l'assimilation est régressive, enfin je crois ;
le suédois semble avoir une assimilation régressive ou progressive de
la surdité dans les affixes, mais pas d'assourdissement en fin de
mot : bröd, [du] pain, est prononcé /brøːd/ avec
un /d/ sonore final, à la différence du
néerlandais brood, prononcé /broːt/ avec un /t/
sourd, au moins en fin de phrase — en allemand, ça s'écrit carrément
avec un ‘t’, Brot). Toutes ces différences font
qu'il faut avoir le cerveau correctement câblé pour prononcer
correctement et dans la bonne langue un mot écrit (il n'est pas
question de réfléchir consciemment aux règles d'assimilation, par
exemple, elles sont trop complexes, et d'ailleurs je serais incapable
de les énoncer complètement).
Bien sûr, il est certain que ces difficultés que j'éprouve
maintenant se résoudront toutes seules (et seront remplacées par
d'autres !) si je persiste dans l'apprentissage de ces langues, au fur
et à mesure que mon cerveau arrivera à se construire des catégories
mentales bien délimitées pour des langues dont ma connaissance pour
l'instant trop primitive les rend assez informes. Je peux néanmoins
me demander quelle approche il vaut mieux adopter pour éviter de me
mélanger les pinceaux : laisser la langue X de côté pendant
une assez longue période lorsque j'apprends la langue Y
avec laquelle je pourrais confondre ? Ou au contraire m'efforcer à
confronter la difficulté, à traduire entre X
et Y et vice versa pour bien m'obliger à constater que
c'est différent ? Les deux stratégies font sens : éviter tout
rapprochement pour éviter tout mélange, ou au contraire faire les
rapprochements pour comprendre et ainsi écarter ce qui peut
m'embrouiller. D'ailleurs, forcément, en écrivant cette entrée, j'ai
dû me forcer à jongler entre différentes langues.
Il faut aussi se demander quel est le but (je ne m'imagine pas
sérieusement pouvoir un jour parler le néerlandais ou le
suédois, juste les comprendre un petit peu, ou simplement me faire une
idée de comment ces langues fonctionnent). Si on se fixe simplement
comme objectif de comprendre des langues, les confusions sont
beaucoup moins nombreuses et moins risquées que si on cherche à s'y
exprimer (mais il y en a : j'ai donné ci-dessus l'exemple
de het huis contre ett hus,
où le sens est bien différent, et qui peut bien poser problème à la
compréhension). Et j'ai tendance à penser qu'il faut apprendre les
langues comme si on se donnait comme objectif d'arriver un jour à les
parler, même si on ne croit pas réalistement arriver à ce stade.
Why English sucks as the language for international and scientific communication
For a change, I'll be writing this entry in English—ironically
because my point is to argue how English is a terrible choice as a
language for international communication, and particularly in
scientific and technical fields. (I initially intended to also
publish a translation into French, and/or perhaps Interlingua, but on
second thought my laziness has persuaded me to pass.) I should start
with a few clarifications.
One is that I honestly don't think I am prejudiced against English.
While English is technically not my first language, since I
only learned it at age 8, or my mother tongue, it is literally
my father tongue, the language in which I communicated with my
father through most of my childhood and adolescence (now that my
father is rather deaf and has difficulty articulating, we tend to
speak French instead, for the phonetic reasons that I am about to
point out below). English is not just a language which I read and
write with pleasure, speak and understand in spoken form, it is also
one in which I often phrase my own internal thoughts, especially when
doing math, and in which I dream: so it is definitely not alien to
me.
Verily, I am in love with it. English is a beautifully poetic
language, capable of summoning vibrant images, crafting rousing
speeches, conveying powerful emotions. And the wonder of it is that
it empowers even the less talented. When English is wielded by the
greatest of the great, by the hallowed likes of Shakespeare or
Nabokov, when reinvented by Whitman and Joyce, it comes as no surprise
that it can inspire awe: it doesn't take a diamond to shine in the
hands of a star. But English is so manifold in its modes of
expression, so opulent in possibilities, so richly laden with quaint
words and nearly frivolous idioms, so mirthfully malleable,
that even a lesser pen can reveal itself in its gleam. If some
languages seem arid, English is their polar opposite: English is
bountiful and ornate, English is a cornucopia of synonyms, a mine for
metaphors, a fountain for apothegms, a luscious garden for the poet;
each idea can be expressed through a whole gamut of terms, and from
each word sprouts a rainbow of meaning. Quite bewildering—and quite
the reason why English is a poor choice when it comes to precise
communication on mundane matters, when poetry is not of the
essence.
I am not trying to argue that we should now give up English for
international or scientific communication, or try to replace it with
this or that other language (except possibly in a limited way, e.g.,
see below on Basic English). I am not proposing to use Interlingua,
Esperanto, Latin, Italian, Chinese, Russian, or anything else:
I am maybe saying that we should have used
Interlingua, Esperanto, Latin, Italian, Chinese, Russian, or something
of the sort (probably any of the above would have been better than
English) in the first place. That we (as a “global” civilization)
have been stupid, bewitched or misguided. That we should realize
this, even if it is now too late to correct our mistake, and perhaps
reflect on the reason why we made it. (But I will not do
this—at least not here and now.) Even if we can't fix things, even if
we can't prevent similar bad choices from being made in the future, we
should at least be aware of them, to contemplate our idiocy and keep
in mind that collective decisions are not necessarily the wisest ones.
(Memento, homo, quia stultus es, et in stultitia
remanebis.) So, again, I am not suggesting a switch away from
English; I will, on the other hand, make a few modest proposals (one
for each major flaw that I find with English) that could
alleviate the problem—I am well aware that even these less radical
proposals have infinitesimal chances of begetting anything concrete,
but their chances are perhaps less infinitesimal than if I were to
suggest using Interlingua instead of English.
There is also, of course, the issue of how unfair the
dominance of English is to all the peoples of the Earth of whom it is
not the first language. How not being raised from the start in the
global lingua franca makes them second-class
citizens, or even third-class ones if they cannot communicate in it at
all. How, contrariwise, native English speakers can find an
opportunity of employment pretty much anywhere in the world by
teaching English. How, even among non native speakers, a good
knowledge of the global language constitutes
a cultural
capital that impedes social mobility for those who lack it. This
is something that would be equally true had any language other than
English been chosen as “Globish” (perhaps choosing a constructed
language would avoid some of the aforementioned problems, but
at the cost of others), so it is orthogonal to the specific problems
with English that I wish to discuss here; this unfairness is also
something that probably cannot be remedied, but that we should still
keep in mind. (And, more importantly, it is a fact which we should
not deny or ascribe to an irrational rejection of English.) I plan to
discuss this aspect of things some other time (viz., probably
never).
Its vocabulary is too
abundant. This comes, in great part, from English being a
Frankenstein-monster kind of hybrid between a(n Anglo-Saxon) Germanic
substratum and good measure of (Norman) French. As a matter of fact,
English is almost a superset of French, because we can look up
practically any French word in
the OED
and find some recorded use of it in English. Now maybe
the OED is an unfair (as in: absurdly large) metric of
English's lexicon, since it includes inscrutable (to modern English
speakers) Anglo-Saxon words or other historical oddities, hapaxes (or
words for which they failed to find a single recorded
instance and which somehow still ended up in the book,
like palumbine—an adjective which means to a pigeon
what canine is to a dog), highly specialized terms and other
things nobody ever says or writes. Nonetheless, it is true that
English often has a redundancy in its vocabulary due to its double
Saxon and Norman
origins: Wikipedia
has a page about this, of course—actually, quite
appropriately, it
has two—and the fact is also famously noted by Sir Walter Scott in
the beginning of Ivanhoe:
The swine turned Normans to my comfort! quoth
Gurth; expound that to me, Wamba, for my brain is too dull, and my
mind too vexed, to read riddles.
Why, how call you those grunting brutes running about on their
four legs? demanded Wamba.
Swine, fool, swine, said the herd, every fool knows
that.
And swine is good Saxon, said the Jester; but how call
you the sow when she is flayed, and drawn, and quartered, and hung up
by the heels, like a traitor?
Pork, answered the swine-herd.
I am very glad every fool knows that too, said Wamba, and
pork, I think, is good Norman-French; and so when the brute lives, and
is in the charge of a Saxon slave, she goes by her Saxon name; but
becomes a Norman, and is called pork, when she is carried to the
Castle-hall to feast among the nobles; what dost thou think of this,
friend Gurth, ha?
It is but too true doctrine, friend Wamba, however it got into
thy fool's pate.
Nay, I can tell you more, said Wamba, in the same
tone; there is old Alderman Ox continues to hold his Saxon epithet,
while he is under the charge of serfs and bondsmen such as thou, but
becomes Beef, a fiery French gallant, when he arrives before the
worshipful jaws that are destined to consume him. Mynheer Calf, too,
becomes Monsieur de Veau in the like manner; he is Saxon when he
requires tendance, and takes a Norman name when he becomes matter of
enjoyment.
Even beyond the specific explanation of Saxon versus Norman
sources, English seems to have a plethora (profusion, abundance,
affluence, bounty, myriad, opulence, wealth, surplus…) of synonyms for
anything. I don't have a precise measurement for this: but my very
unscientific experience that, in writing literature in French, when I
look for a synonym, the quest is generally much less fruitful than in
English. In French I often have a hard time finding a word that I
like: in English I have a hard time choosing a word that I
like. And French itself probably has an uselessly large lexicon
anyway.
Unlike the—uh—sensible, i.e., lexically agglutinative languages
like German, Hungarian, Turkish, Finnish, Japanese or the like,
English doesn't allow you to construct your own words (only your own
syntagms by juxtaposing words in its quirky ambiguous syntax, see
below). You just have to know (i.e., learn) which ones
exist. Few suffixes are productive; even those that are suffer from
odd exceptions (for example, -ly normally makes an adverb out
of an adjective, e.g., happy→happily, but costly
is inexplicably an adjective, and there is no way to make it
into an adverb: there is no such English word as costlily; why?
because fuck you). English vocabulary is a hodgepodge of words
randomly imported from various other languages or constructed by
arbitrary means and which cannot be analyzed systematically. For
example: hodgepodge (neither hodge nor podge
exist in English—well, the second exists because English has
everything, but doesn't seem related—so you can't explain it, you just
have to memorize the freak). Or why does English need to have the
absurdly specific and un-analyzable word serendipity (which
German might render with the perfectly
analyzable Zufallsfund)?
or adamant? cantankerous? rigmarole? niggardly?
(I chose these examples because these words look like they
can be broken down into pieces, but in fact they can't. And they're
fairly common: I'm not going to go into cachinnation or—Athena
forbid!—the utterly absurd eleemosynary. The only possible
answer to the word eleemosynary is go home, English, you're
drunk!.) I realize that every language has this sort of things,
but English makes it into a perverse art. English is a wanton word
hoarder with a fetish for the heirlooms of Papa German and Mama French
(or is it the other way around?).
Pendant le week-end, des panonceaux sont
apparus un peu partout dans l'école où je travaille (cf. photo
ci-contre, cliquez pour agrandir) avec des instructions de sécurité,
en français, anglais, espagnol, chinois, russe et arabe (c'est-à-dire
l'ensemble des langues officielles de l'ONU, qui
sont un ensemble assez raisonnable de langues à choisir si on veut
être largement compris dans le monde : j'approuve donc ce choix, même
si je ne suis pas totalement convaincu de son utilité réelle à cet
endroit précis, mézenfin).
Je ne vais pas chercher à pointer du doigt les fautes de
traduction. Mais regardons un peu les caractères arabes utilisés sur
cette affiche. Si j'essaie de reproduire l'effet
en HTML, ce sera quelque chose comme ceci :
تعليمات السلامة
(sur un navigateur avec les bonnes polices et bien respectueux des
standards, ce qui précède devrait reproduire les caractères arabes en
blanc sur bleu juste après Правила Безопансости,
qui devrait d'ailleurs être Правила
Безопасности). En fait, ce qu'on voulait écrire est
plutôt ça :
تعليمات السلامة
Vous ne voyez pas la ressemblance ? Le problème est qu'on a écrit
les bonnes lettres arabes, mais (1) de gauche à droite, alors que
l'arabe s'écrit de droite à gauche, et (2) sans les lier entre elles,
alors que l'arabe a une écriture cursive où les caractères se
connectent les uns aux autres (et changent de forme en fonction de
cette connexion). Même sans connaître l'alphabet, en comparant les
deux versions ci-dessus (du moins, si votre navigateur les a affichées
correctement), sachant que les points marquant certaines lettres ne
changent pas quand on connecte la lettre à d'autres, vous devriez voir
la correspondance.
C'est un bug que j'ai vu assez souvent, quoique jamais encore sur
un panneau officiel. J'avais déjà
donné un exemple dans
une entrée passée (mais là je ne
suis même pas sûr que c'était des mots arabes et pas juste des lettres
tapées au hasard). J'avais aussi vu
passer cette photo prise à
l'US Open autour de 2013 (les caractères arabes sont en
bas à droite : c'est censé être quelque chose
comme القادمين
بنر حب, dont je ne suis d'ailleurs
pas convaincu que ça veuille dire grand-chose, mais en tout cas c'est
mal écrit et ça ressemble
à القادمين
بنر
حب — pour le coup, au moins,
c'est dans le bon sens). Et je me souviens aussi avoir vu un acteur
porno gay avec un tatouage tout aussi mal écrit aux alentours de son
nombril, un de mes lecteurs va certainement pouvoir me dire qui
c'était exactement [ajout : il s'agit
de Topher
DiMaggio — images pas complètement SFW].
Mise à jour : L'information a été remontée, et les
panneaux dans mon école vont être corrigés ou refaits.
Je suppose que c'est ce qui se produit quand quelqu'un fait du
copier-coller de caractères Unicode arabes dans un logiciel qui ne
gère pas du tout les écritures de droite à gauche et/ou les
complexités typographiques des écritures présentant des ligatures.
(Par exemple, dans un terminal texte sous Unix, l'arabe a
effectivement tendance à ressembler à ce genre de monstruosités.) Je
suppose que la personne qui copie-colle n'a aucune connaissance de
l'écriture arabe et reçoit les caractères à copier-coller de quelqu'un
qui les a écrits correctement, et il fait confiance, à tort, au
logiciel pour ne pas massacrer les choses lors du copier-coller.
Maintenant, c'est quand même triste, à la fois que ce genre d'erreurs
se produisent (i.e., qu'il existe des logiciels de mise en page
incapables de gérer la bidirectionalité, et qui n'affichent pas, au
minimum, un énorme avertissement si on essaie de taper de l'arabe), et
qu'elles ne soient pas détectées, i.e., qu'il y a des gens à ce point
ignorants de ce qui est quand même une langue relativement fréquemment
parlée en France, pour ne même pas savoir à quoi son
écriture ressemble (et spécifiquement, que les caractères
sont liés les uns aux autres). Surtout que là, des gens parlant arabe
et qui vont passer devant le panneau, il y en a (et ce n'aurait pas
été difficile d'en trouver pour relire l'affiche avant de l'envoyer à
l'impression !). Ou pour remarquer que c'est suspect que les
caractères s'insèrent de la gauche vers la droite et ne présentent
aucun signe de directionalité droite-vers-gauche. (OK,
on peut s'imaginer que l'informatique a décidé de gérer
l'arabe en stockant les textes à l'envers pour faire semblant qu'il va
de gauche à droite, mais on doit quand même vite se rendre compte
qu'il y a plein de problèmes avec ça.)
C'est le genre de choses qui me fait trouver qu'il devrait y avoir
des cours de culture générale à l'école, où on apprendrait entre
autres des généralités sur les langues du monde, et au minimum à
savoir reconnaître les grands systèmes d'écriture et un peu à quoi ils
ressemblent. Je ne parle pas forcément de savoir distinguer du tamoul
et du malayalam, mais au moins d'avoir des grandes idées sur les
principes de différents systèmes d'écritures. Pour un fou d'Unicode
comme moi, ce sont des connaissances aussi basiques que de savoir que
la première guerre mondiale a duré de 1914 à 1918.
Je dis souvent que s'agissant de conventions linguistiques et
typographiques, le plus important est d'essayer d'être un peu cohérent
et systématique. Et pour ça, il est important de se fixer des règles
dont on trouve la logique satisfaisante, de manière à ne pas toujours
changer d'avis. Mais ce n'est pas facile quand on se met à couper les
cheveux en quatre.
Voici un exemple du genre de questions dont je veux parler : si je
dois faire référence (alors que je parle français ou anglais) au
premier président de la Chine communiste, dois-je l'appeler Mao
Zedong ou Zedong Mao ? (Ou Máo Zédōng en écrivant
les tons, mais pour une fois ce n'est
pas ça qui me préoccupe.) Le fait est que le nom de famille
est Mao (毛), et la question est de
savoir comment l'ordonner par rapport au prénom (enfin, au nom
personnel, qu'il vaut mieux ne pas appeler prénom quand on
discute justement de l'ordre de placement). Les sinophiles me disent
généralement que la question ne fait pas l'ombre d'un doute, en
chinois le nom de famille précède le nom personnel : c'est
incontestablement le cas quand on utilise un nom chinois en chinois,
mais ici je parle d'utiliser un nom chinois en français, et il s'agit
donc de se demander qui l'emporte, la convention chinoise ou la
convention française — ou plus exactement, de savoir si l'ordre
des parties d'un nom propre est relié au nom lui-même ou à la langue
dans laquelle on s'exprime, et ce n'est pas évident du tout.
Il est sûr que la question ne peut pas admettre de réponse
pleinement satisfaisante. Il y a trop de cas dictés par l'habitude
pour qu'on puisse espérer être complètement cohérent : s'agissant de
Mao Zedong, l'usage français s'est figé dans cet ordre, mais
inversement, il y a un nombre non négligeable, par exemple, de
Hongrois, pour lesquels on a pris l'habitude de retranscrire leur nom
dans l'ordre prénom+nom (par exemple Erdős Pál → Paul Erdős), et de
toute façon les célébrités ont souvent des bizarreries de nommage
(pourquoi parle-t-on de Jules César mais de César
Auguste ? — noter qu'aucune des deux parties, ici, n'est un
prénom, le prénom de naissance serait Gaius pour les deux, mais
Auguste a changé son prénom en Imperator en ~38 ; pourquoi
Dante Alighieri, Michelangelo Buonarroti et Rembrandt Harmenszoon
van Rijn sont-ils connus par leur prénom ? à la fin, il faut cesser de
chercher une logique et reconnaître que l'usage fait loi). On peut
néanmoins chercher à systématiser l'usage pour les personnes qui ne
sont pas spécialement célèbres. Une solution est de choisir un ordre
quelconque et de mettre le nom de famille en petites capitales ou de
le souligner d'une manière ou d'une autre (quand il y en a un
identifiable, ce qui n'est pas toujours le cas, notamment pour
certains noms indiens ou les noms islandais), et
d'écrire Máo Zédōng ; je ne suis pas fan de cette solution, que
je trouve assez laide (quand on a un texte plein de noms propres, ça
donne une impression vraiment trop didactique-pontifiante), mais il
faut admettre que c'est ce qu'il y a de plus clair.
Voici un problème apparenté : supposons que je veuille parler de la
personne élue à la tête d'une municipalité belge, disons, Namur :
dois-je parler du maire de Namur ou du bourgmestre de
Namur ? Là aussi, on me sort généralement une réponse un peu
toute faite : en Belgique, on parle de bourgmestres —
certes, c'est-à-dire que les Belges utilisent le
terme bourgmestre pour désigner l'édile de leurs villes, mais
moi je ne suis pas Belge, et je parle, si j'ose dire,
dans une variante
du fr-FR et non du fr-BE. Ce que je veux
dire, c'est qu'il n'est pas du tout clair si le choix d'un titre
comme maire ou bourgmestre doit être déterminé par la
variante régionale du français qu'on parle ou par le pays qui attribue
la fonction officielle. (Dans le genre, si je veux désigner
l'adresse rue Rogier 70 à Namur, il semble raisonnable de
penser que je doive mettre le numéro après le nom de la rue parce que
c'est ainsi qu'on fait en Belgique, mais nettement moins raisonnable
de penser que je doive obligatoirement prononcer septante parce
que les Belges disent ça et que c'est une adresse en Belgique.)
En l'occurrence, je suis plutôt tenté de considérer l'usage du
mot bourgmestre comme un régionalisme belge (qui, du coup,
apparaît dans les textes légaux définissant la fonction) que comme une
fonction spécifique dont le nom doit être préservé. Après tout, pour
les villes néerlandaises, allemandes et autrichiennes, on a bien
tendance à préférer en français (de France) le terme de maire
même si ces gens devraient logiquement être tout autant bourgmestres
que leurs homologues belges. Et je n'ai presque jamais entendu
utiliser en français le mot alcade pour une ville espagnole
ou syndic pour une ville italienne alors que ces mots existent.
Mais surtout, je vois mal quelle différence fonctionnelle on peut
trouver à l'usage d'un mot ou de l'autre : les anglais disent presque
toujours mayor pour la personne à la tête d'une
ville, ou qu'elle soit, même si la
transcription burgomaster
ou burghermaster existe en principe, et ça ne
semble pas causer de problème. De toute manière, j'ai déjà souligné
(sur l'exemple du président du Conseil et ses variantes) à quel
point les titres officiels sont la
province du Club Contexte. Bref, il me semble plus simple et
finalement plus cohérent de parler de maire partout, y compris
pour les villes belges, ou alors de parler de bourgmestre
partout si on préfère ce mot, mais en tout cas de ne pas faire la
distinction selon le pays ou le titre officiel.
Encore une question du même acabit : il est fréquent d'utiliser en
français des guillemets « comme ceci », en anglais “comme ça” (ou
‘ça’) et en allemand „ainsi“ (ou »ainsi«), à tel point que certains
considèrent que c'est une obligation de conformer le choix des
guillemets au choix de la langue (à mon avis, c'est parfaitement
stupide, cf. ci-dessous). Maintenant, en admettant qu'on fasse ces
choix pour un texte entièrement écrit dans une langue, la question se
pose encore de savoir ce qu'on doit faire quand on en mélange
plusieurs : le choix des guillemets (et autres conventions
typographiques apparentées) doit-il être dicté par la langue
majoritaire du texte (pour avoir une même convention sur tout le
texte), par la langue immédiatement autour, ou, dans le cas des
guillemets, par la langue intérieure aux guillemets ? — et de
nouveau, ce n'est pas du tout évident. Je fais personnellement le
choix de régler les conventions selon la langue immédiatement autour
(et donc, dans le cas des guillemets, extérieure aux
guillemets), mais pour revenir à ce que je disais tout au début, le
plus important me semble d'essayer d'être cohérent (et par exemple,
quoi qu'en disent les maniaques du Lexique des règles
typographiques en usage à l'Imprimerie Nationale — ouvrage
d'ailleurs fort mal écrit et fort peu
cohérent[#] — je trouve
parfaitement raisonnable qu'on décide d'utiliser les mêmes conventions
typographiques dans tout ce qu'on écrit, indépendamment de la langue,
pour plus d'uniformité).
[#] Le plus ironique
étant que ce Lexique préconise très clairement d'utiliser
des accents sur les capitales alors que l'Imprimerie Nationale édite
elle-même le Journal Officiel de la République française
sans mettre ces accents ! Et je remarque aussi que selon les règles
qu'ils donnent sur l'emploi des majuscules (ou du moins l'espèce de
cafouillis qui tient lieu de règles dans ce Lexique) il
serait plus logique d'écrire Imprimerie nationale et Journal
officiel que Imprimerie Nationale et Journal
Officiel. Bref, une chose est sûre, c'est qu'ils ne savent pas ce
qu'ils veulent. Je ne comprends pas que ce livre ait malgré tout du
succès auprès des maniaques ! Mais au sujet des majuscules
à Imprimerie Nationale, voici une autre question du même
genre : faut-il suivre l'usage défini par l'organisme qui porte le
sigle ou bien uniformiser dans le texte ? (autrement dit,
si moi je trouve plus cohérent d'écrire Imprimerie
nationale parce que l'adjectif suit le nom, dois-je quand même
mettre une majuscule à celui-ci parce que ce choix fait partie du nom
ou dois-je considérer que ma convention l'emporte ?).
Je suis tombé complètement par hasard sur un livre de l'ariste
chinois (ou
sino-américain) Xú Bīng
(徐冰) intitulé Une histoire sans mots. Enfin, ça
c'est le titre sous lequel le livre est paru en France, mais c'est
plutôt une description qu'un titre : aux États-Unis il est paru (ou va
paraître) sous le nom From Point to Point,
et en chinois sous le nom 从点到点 (dont
le titre anglais est la traduction), mais en fait le vrai titre de ce
livre est plutôt quelque chose comme : • → 👨︎ → • (un
point, une flèche vers la droite, le dessin d'un homme, une flèche
vers la droite, un point ; malheureusement, Unicode n'a pas le simple
dessin d'un homme stylisé comme on utilise par exemple pour
représenter les toilettes pour homme, ce qui est d'ailleurs vraiment
bizarre, alors j'ai mis un U+1F468 MAN à la place, mais le glyphe de
référence est une tête — passons [mise à jour
() : maintenant il y a U+1F9CD STANDING PERSON
donc je pense que j'écrirais le titre comme • → 🧍︎ → •]).
L'édition française n'est pas une traduction de l'édition chinoise
ou américaine, puisqu'il n'y a rien à traduire : comme le dit le titre
français, il s'agit d'une histoire sans mots. Racontée uniquement
avec des pictogrammes ou idéogrammes : je ne rentrerai pas dans la
question byzantine de la différence entre les deux, qui est souvent
très floue, mais en tout cas il ne s'agit pas d'idéogrammes chinois,
mais de symboles très internationaux comme celui dont je me plains de
l'absence dans Unicode au paragraphe précédent, des flèches, des
signes de ponctuation, des smileys, des symboles mathématiques, des
icônes largement connues, des panneaux routiers, des logos de marques,
des dessins stylisés d'objects courants, etc.
Le thème de l'histoire, c'est 24h dans la vie du héros, dont on ne
sait pas le nom mais qui est représenté par le dessin d'un homme
stylisé noir (les autres personnages sont représentés de différentes
autres couleurs). Pour donner une idée, voici à quoi ressemble un
passage qui raconte que le héros reçoit un mail d'un couple d'amis
annonçant qu'ils ont eu un enfant et invitant à regarder la photo en
attachement, que le héros regarde la photo, trouve le bébé plutôt
monstrueux, mais se dit qu'il vaut mieux ne rien dire, donc répond en
disant qu'il a vu la photo, qu'il trouve le bébé très mignon,
félicitations :
Cet extrait est (je trouve) relativement représentatif.
Globalement, l'histoire se comprend assez bien, même s'il faut parfois
réfléchir un peu (quelques passages sont des petits casse-tête) et
j'avoue que quelques fois je n'ai compris que l'idée générale et pas
toutes les nuances. C'est surtout très amusant à lire, à la fois par
le contenu de l'histoire et par l'astuce avec laquelle certaines idées
sont véhiculées, et je pense que c'est ça qui intéresse l'artiste. On
peut regretter que les symboles utilisés manquent parfois un petit peu
de cohérence (par exemple, les symboles de mains approbatrices ou de
certains objets comme le téléphone varient de façon assez
inexplicable), ou qu'ils ne soient pas toujours très soignés (certains
smileys sont grossièrement pixellisés), mais le concept, en tout cas,
me plaît énormément, et je suis assez impressionné du résultat.
Je pense que l'expérience est intéressante non seulement
artistiquement mais aussi du point de vue des sciences cognitives. Il
faudrait voir à quel point le livre est compréhensible dans tous les
pays (même si rien n'est dit explicitement du lieu où se passe
l'action, il y a quand même des éléments culturels qu'on peut relever,
par exemple le fait que les toilettes du héros sont la même pièce que
la salle de bains, ou le fait que les gens sur les réseaux sociaux de
rencontres indiquent quel est leur groupe sanguin). Il faudrait
mesurer la vitesse à laquelle on déchiffre (certainement beaucoup plus
lente qu'un texte écrit avec des mots). Il faudrait voir à quel point
c'est compréhensible par un enfant, par des personnes ayant subi des
dommages aux zones du langage dans le cerveau, que sais-je encore.
Le « langage » dans lequel le livre de Xú Bīng est écrit est
destiné à être spontanément compréhensible sans apprentissage
préalable, même si l'auteur utilise, et je pense qu'il fait bien, un
certain nombre de conventions avec lesquelles on se familiarise assez
vite : par exemple, les heures du jour et de la nuit sont indiquées
par des pendules blanches et noires respectivement, certaines
précisions sur une idée sont développées entre une paire de
parenthèses reliée à l'idée principale par un tiret, et quelques
autres choses du même genre. En s'autorisant un apprentissage
minimal, on peut probablement mettre en place un langage idéographique
encore beaucoup plus expressif que le code de ce livre, et néanmoins
beaucoup plus facile à apprendre qu'une langue naturelle, qui pourrait
avoir un intérêt non nul comme système de communication internationale
primitif. Je sais qu'il y a quelques tentatives dans ce sens,
notamment
les symboles
Bliss (sur lesquels j'aimerais bien en savoir plus, et dont je
m'impatiente qu'ils entrent dans Unicode), ou encore une application
pour téléphones mobiles
appelée iConji, dont
l'utilité potentielle est malheureusement réduite à néant par le fait
qu'elle est propriétaire : le principe général me semble très bon, je
trouve dommage qu'il ait été si peu exploré (et que les seuls
inventaires vaguement utilisables d'idéogrammes soient les caractères
égyptiens et chinois, tellement liés aux spécificités de ces
civilisations).
Pourquoi Shakespeare fait-il rimer love et prove ?
[Ceci est un résumé d'un débat que j'ai eu tout
récemment avec deux ou trois amis férus de linguistique.]
Dans cette
vidéo qui discute de la réconstitution de la prononciation de
l'époque de Shakespeare, il est question (à partir
de 6′)
du sonnet 116,
qui se termine par les vers :
If this be error and upon me proved, I never writ, nor no man ever loved.
De nos jours, évidemment, loved (/lʌvd/)
et proved (/pɹuːvd/) ne riment absolument pas.
Il est possible qu'ils n'aient pas non plus rimé à l'époque de
Shakespeare (i.e., que la rime soit purement graphique) ; mais David
Crystal (le vieux barbu dans la vidéo),
dans cet
article expose des arguments assez convaincants pour expliquer que
si, en citant notamment la grammaire anglaise
de Ben Jonson
(qu'on
peut trouver
en ligne ici, je recommande la version DjVu parce que la
version PDF met dix secondes à changer de page sur mon
ordinateur), où ce contemporain de Shakespeare écrit (page 17 de
l'édition mentionnée, 37 du fichier DjVu) :
O
Is pronounced with a round mouth, the tongue drawn back to the
root; and is a letter of much change and uncertainty with us.
In the long time it naturally soundeth sharp, and high; as in
[…] It holds up, and is sharp, when it ends the word, or syllabe;
as in
gó, fró, só, nó.
Except intò, the preposition; twò, the
numeral; dò, the verb, and the compounds of it; as undò,
and the derivatives, as dòing.
It varieth the sound in syllabes of the same character,
and proportion; as in
shòve, glòve, gróve.
Which double sound it hath from the Latin; as
voltus, vultus; vultis, voltis.
— il confirme donc explicitement que love
et prove avaient la même voyelle et de plus que
cette voyelle était brève. (Dans la vidéo, les deux mots
sont prononcés avec la voyelle /ʌ/
de STRUT, qui est celle
de love en anglais moderne, mais comme je vais le
dire je pense que c'est incorrect.)
L'explication évidente à première vue serait la suivante : à
l'époque de Shakespeare, love
et prove avaient la même voyelle, et pour une
raison ou une autre, ces voyelles ont divergé. Mais la réalité est
forcément plus compliquée, et comme je vais l'expliquer il y a un
certain mystère là-dessous.
La première chose qu'il faut savoir c'est qu'en moyen
anglais, love
s'écrivait luve (de l'ancien
anglais lufu) : la raison pour laquelle la
voyelle a changé de ‘u’ à ‘o’ est purement graphique et ne reflète
aucun changement de prononciation — c'est probablement simplement que
dans
l'écriture
minime il était difficile de se repérer dans une succession de
jambages, donc on a préféré écrire un ‘o’ plutôt qu'un ‘u’ avant un
autre ‘u’ (qui est maintennat un ‘v’). Mais le
mot love a toujours eu en anglais un ‘u’ bref.
Cette voyelle a subi plus tard (après Shakespeare), dans la plupart
des accents anglais (excepté celui du nord de l'Angleterre) ce qu'on
appelle
le FOOT-STRUT
split, c'est-à-dire qu'elle a donné deux voyelles différentes
en anglais moderne, le /ʊ/ de FOOT (comme
dans put) et le /ʌ/
de STRUT (comme
dans cut) : le mot love a
pris la branche STRUT et c'est sa
prononciation actuelle ; mais a priori cette division ne nous
concerne pas, puisqu'à l'époque de Shakespeare elle n'avait pas eu
lieu, et love devait donc avoir le ‘u’ bref
commun, probablement prononcé assez près de [u] (donc avec le même
timbre que la voyelle actuelle de GOOSE,
mais en plus bref).
Ce point étant éclairci, passons au mystère
de prove. En moyen anglais, il s'écrit avec un
‘o’ (il vient de du français normand prover), et comme
l'orthographe du moyen anglais est a priori assez phonétique,
il y a lieu de penser qu'il ne rimait pas
avec love, disons, au XIIIe siècle
(même s'il n'est pas complètement interdit de penser que les choses ne
soient pas claires : déjà, en français, prover s'est bien
transformé en prouver d'une manière ou d'une autre). Si ce ‘o’
était long, il se serait altéré régulièrement, au cours du
XVe siècle, sous l'action
du Great
Vowel Shift, vers le timbre /uː/ qu'il a actuellement. Ce
serait l'explication la plus plausible, mais ceci voudrait
dire qu'à l'époque de Shakespeare prove aurait eu
un /uː/ (long !) alors que love aurait eu un /u/
(bref !), donc la rime serait imparfaite et surtout, ceci contredit
l'affirmation explicite de Ben Jonson (cité ci-dessus) selon laquelle
la voyelle de prove est brève. D'où le
mystère.
Comment expliquer ce mystère ? Je vois deux pistes, dont aucune ne
me satisfait franchement (mais qui sont toutes les deux d'accord sur
le fait que la voyelle des deux mots à l'époque de Shakespeare devait
être /u/). La première est la suivante :
en moyen anglais, luve/love a un ‘u’ bref
et prove a un ‘o’ long,
prove subit le GVS au
XVe siècle et sa voyelle devient donc un /uː/, dont le
timbre est alors identique à celui de love,
pour je ne sais quelle raison, prove est
parfois prononcé au XVIe–XVIIe avec la voyelle
brève (peut-être surtout chez des gens savants et qui savent écrire,
qui sont inspirés par l'analogie avec les mots
comme love),
c'est cette prononciation que Ben Johnson enregistre dans sa
grammaire (en attribuant à prove un son bref) et
que Shakespeare utilise pour ses rimes (peut-être aussi juste parce
que ça l'arrange),
mais la prononciation longue finit par l'emporter, et de son côté
la voyelle brève de love diverge vers /ʌ/, donc
on a la différence actuelle.
C'est assez déplaisant de devoir supposer que la prononciation
aurait changé (fût-ce seulement chez certaines personnes) à l'époque
de Shakespeare pour revenir ensuite à ce qu'elle était.
Autre explication, qui me plaît encore moins :
en moyen anglais, luve/love a un ‘u’ bref
et prove aussi, l'écriture de ce dernier venant
de l'analogie avec love (transformée en
convention bien établie : ‘u’ bref devant ‘v’ s'écrit ‘o’),
c'est encore le cas à l'époque de Shakespeare, donc les mots
riment,
pour je ne sais quelle raison, la voyelle
de prove s'allonge alors que celle
de love reste brève,
puis, de son côté, la voyelle brève de love
diverge vers /ʌ/, donc on a la différence actuelle.
Cette explication pose deux problèmes : d'abord,
l'écriture prove est attestée au début du
XIIIe siècle d'après l'OED, donc sans doute
trop tôt pour pouvoir être par imitation
de love ; ensuite, on ne voit pas de raison
évidente pour laquelle la prononciation de prove
aurait divergé de celle de love et
de above si elles ont coïncidé jusqu'au début du
XVIIe.
Bref, je ne sais pas bien quoi penser. Autre sujet de mystère :
pourquoi Ben Jonson, dans le passage cité ci-dessus, ne mentionne-t-il
pas la prononciation de LOT (les mots
comme not, hot, etc., qui
ont maintenant un /ɒ/) ? Il est très étonnant que la seule
prononciation qu'il mentionne pour le ‘o’ bref soit celle qui est
homophone avec un ‘u’ bref (peut-être est-ce qu'il ne considère que
les mots où ‘o’ finit une syllabe ouverte). Bizarrement, David
Crystal (toujours le vieux barbu de la vidéo),
qui a écrit tout un
livre sur la prononciation de Shakespeare, ne mentionne pas non
plus cette voyelle dans l'appendice du livre en question où il tente
d'expliquer comment prononcer les voyelles de l'époque.
Comme je l'avais déjà mentionné,
j'essaie de perfectionner un peu mon allemand (ou devrais-je dire, de
combler les années où je l'ai à peu près complètement laissé tomber,
entre la fin de ma prépa et le moment où je
suis allé à Berlin), avec l'idée
que mon poussinet et moi comptons aller à Munich début septembre.
Disons que mon but est de parler allemand mieux que l'Allemand typique
ne parle anglais, histoire que ce ne soit pas complètement inutile
d'utiliser cette langue — et ce n'est pas forcément acquis. Je
combine différentes méthodes :
l'Assimil
avancé (qui a l'avantage de me fournir un nombre assez limité de
phrases avec un nombre assez limité de mots nouveaux que je peux donc
réécouter ad lib. jusqu'à ce que ça rentre parfaitement dans ma
mémoire essentiellement auditive),
le Tagesschau
du Norddeutscher Rundfunk, et la lecture
du Spiegel. (Ce
serait bien si je trouvais un forum intéressant de geeks
germanophones, aussi, histoire d'être exposé à un allemand plus
informel.)
Une des difficultés de l'allemand est que les noms ont un genre (un
parmi trois : masculin, neutre ou féminin). C'est amusant comme le
cerveau est fait : si une langue avait trois genres mais que le genre
d'un nom fût infailliblement (ou avec très très peu d'exceptions)
indiqué par une voyelle à la fin du mot, ce ne serait pas d'une grande
difficulté de les apprendre, puisqu'on apprend le mot comme un tout ;
mais sous prétexte que le genre, au lieu d'être indiqué par la fin du
mot est indiqué par un article qui vient avant (et surtout, qui n'est
pas absolument toujours présent), le cerveau le considère comme une
information auxiliaire et on a beaucoup plus de mal à l'apprendre !
(Du coup, je me demande comment le cerveau s'en tire pour les langues
scandinaves qui indiquent le genre des noms utilisés avec l'article
défini, en postposant celui-ci sous forme d'un suffixe, mais pas celui
des noms utilisés avec l'article indéfini.) C'est à tel point,
d'ailleurs, que l'apprentissage des pluriels est (à mon avis) beaucoup
plus facile que celui des genres, et que j'en viens parfois à
retrouver le genre d'après le pluriel (si le mot sonne bien avec un
pluriel de féminin, il a des chances d'être féminin).
Bref, je me constitue une longue liste de mos courants, ou plutôt
de racines courantes (parce que le genre d'un mot allemand est
normalement déterminé par son dernier élément, même s'il y a quelques
exceptions, soit parce qu'un mot peut avoir deux genres
— der Vorteil mais das
Gegenteil — soit probablement parce que l'analyse est trompeuse
— der Bericht mais die
Nachricht : je retiens justement ce dernier parce que je sais bien
que les pluriels sont die Berichte
mais die Nachrichten). Majoritairement masculins
et neutres parce que les féminins sont souvent très reconnaissables
(sans compter qu'il est quasiment impossible d'utiliser un féminin
sans que ça s'entende, alors qu'on peut facilement faire une phrase où
on ne saura pas si un mot est masculin ou neutre). Et tous les jours
je les fais afficher par mon ordinateur dans un ordre aléatoire et je
contrôle que je les connais tous parfaitement, et quand je fais une
faute sur l'un d'entre eux, je me répète quelques phrases l'utilisant
et qui mettent bien en évidence le genre. De surcroît, à chaque fois
que je pense à un mot allemand, je m'assure d'être certain de son
genre (et j'ai une petite application dictionnaire sur mon téléphone
qui me permet de faire ça à tout moment). Voilà ce que j'aurais dû
faire il y a bien longtemps, parce que maintenant je dois surtout
réapprendre une quantité faramineuse de vocabulaire allemand que j'ai
mal apprise puisque j'ai fait l'impasse sur les genres. Mais le plus
énervant, il faut le dire, ce sont encore les mots importés par
l'allemand d'autres langues et qu'on a affublés de genres assez
aléatoires : das Internet, der
Automat, der Computer, das
Hotel, der Bus, die
Jeans, etc.
Il n'y a pas, bien sûr, que le genre des mots que je dois
apprendre : je ne veux pas donner l'impression que je parlerais
parfaitement la langue si ce n'était cette petite difficulté. À vrai
dire, mon vocabulaire est cruellement limité (parce que j'ai toujours
été passionné par la grammaire
alors que je trouvais pénible d'apprendre des séries de mots) et je me
fais donc aussi des listes de termes ou d'expressions que je trouve
potentiellement utiles. Il y a du vrai dans le fait qu'on apprend
plus vite du vocabulaire en allemand que, disons, en anglais, à cause
de la possibilité de former des mots composés qui fait qu'il est, au
minimum, plus facile de comprendre ou de retenir un mot quand on en
connaît les parties (Zufalls+fund : découverte
due au hasard) que si c'est, au hasard, un mot importé d'une obscure
légende persane (je pense à l'équivalent anglais du
précédent : serendipity). J'aime bien dire qu'il
n'y a rien de plus mauvais que les « moyens mnémotechniques » qui ne
touchent pas à un vrai phénomène, et que pour retenir, par exemple, le
un mot dans une langue, si on a du mal, il faut chercher à en garder
en mémoire l'étymologie, ou un cognat, ou une expression l'employant,
ou quelque chose comme ça qui fasse appel à un vrai fait
linguistique : l'allemand est plutôt plus agréable pour ça que
d'autres langues. (Je le sais parce que je me fais aussi des listes
de mots que j'apprends en français et en anglais.)
Parlant de mots composés, il y a une chose qui m'amuse beaucoup,
c'est quand on trouve des étymologies complètement parallèles dans
différentes langues. Je me rappelle notamment avoir eu une sorte
d'épiphanie en remarquant sur un emballage alimentaire dont les
ingrédients étaient indiqués en français, en néerlandais et en grec,
que le mot com+position se disait en
grec σύν+θεση (synthèse, quoi) et en
néerlandais samen+stelling — autrement dit, dans
les trois langues, posé ensemble. (En
allemand, Zusammen+stellung semble plutôt
désigner une com+pilation, tandis qu'une com+position chimique
se désignera par Zusammen+setzung, autrement dit,
on asseoit les com+posants ensemble plutôt qu'on ne les pose debout :
tout est dans la nuance.) Mais je digresse.
Il faut reconnaître que les mots composés allemands ne sont pas
toujours très transparents. Je pense par exemple au
préverbe ver- que certains analysent comme
indiquant la perte de quelque chose, mais qui semble plutôt avoir pour
signification de « transformer le sens du verbe de manière
complètement imprévisible » (ce n'est pas le seul qui fasse ça, mais
ça doit être le plus courant) :
Je voyage très peu. Que ce soit une cause ou
une conséquence de ce fait, je ne sais pas bien, mais c'est
en tout cas certainement lié au principe (que je considère comme le
minimum de respect à avoir pour tout endroit qui m'accueille, fût-ce
brièvement) que je ne mets pas les pieds à un endroit sans avoir fait
un effort raisonnable d'apprendre la langue locale. Un effort
raisonnable, évidemment, ça ne veut pas dire que je me fixe comme
but de la parler couramment, mais il est aussi hors de question de me
contenter d'apprendre à baragouiner les mots pour
dire bonjour, merci, au revoir et je ne parle
pas klingon. Par exemple, en
japonais[#], je sais dire ce
kimono n'est pas bleu : on ne sait jamais, ça pourrait servir, des
fois que le kimono serait rouge. Plus sérieusement, ce qui
m'intéresse avec les langues, ce n'est pas tellement d'apprendre des
longues listes de vocabulaire, mais d'avoir une idée basique sur la
façon dont elle fonctionne, une idée de la logique et de la
structure, bref, plutôt de la
grammaire[#2] voire de la
philologie ; mais aussi arriver à créer un petit compartiment de mon
cerveau pour cette langue et pour sa « mélodie » propre. Disons qu'en
général le niveau que je vise dans une langue — sans forcément
l'atteindre — est à peu près celui qui me permettrait, si j'ai à ma
disposition un texte bilingue, de retrouver quel mot de
l'original va avec quel mot de la traduction, et de comprendre la
structure du texte et de l'apprécier, même si je ne pourrais pas le
comprendre sans aide. Je procède en utilisant en parallèle la méthode
Assimil (j'en ai déjà parlé) pour
assouplir mes neurones à la musique de la langue et tirer le meilleur
parti de ma mémoire principalement auditive, et d'autre part des
grammaires ou textes linguistiques pour satisfaire ma curiosité.
Bref. On m'invite pour deux jours aux Pays-Bas (à Leiden), pour
évoquer un travail
mathématique. Je n'aurai sans doute pas l'occasion d'articuler un
mot de néerlandais (sauf peut-être au début de mon exposé pour
remercier les organisateurs), mais peu importe : j'ai acheté l'Assimil
néerlandais, et j'en suis actuellement à la 13e
leçon[#3].
Forcément, si je connais déjà l'anglais et l'allemand, le
néerlandais (que certains ont décrit comme la langue que des marins
allemands et anglais saouls se sont mis à parler ensemble après un
trop long temps passé en mer) devrait être plus facile que, oh,
disons, l'arabe. D'autant plus qu'à peu près tous les produits
alimentaires vendus en France ont un double étiquetage en français et
en flamand pour pouvoir être vendus en Belgique, et que je suis du
genre qui lit ce genre de choses. Toujours est-il que, pour ce qui
est du néerlandais écrit, je comprends spontanément des choses très
faciles, comme l'extrait suivant de
la page d'accueil
de nl.wikipedia.org aujourd'hui :
18 mei – Emmelie de Forest wint namens Denemarken het 58e
Eurovisiesongfestival met het nummer Only
Teardrops. Nederland eindigt negende met Anouk,
België is twaalfde met Roberto Bellarosa.
18 mei – De Franse president François Hollande ondertekent de wet
op het homohuwelijk. Mensen van hetzelfde geslacht kunnen in
Frankrijk vanaf eind mei met elkaar trouwen.
[Traduction littérale : 18 mai
— Emmelie de Forest gagne au nom du Danemark le 58e festival de
chanson de l'Eurovision avec le numéro Only
Teardrops. Les Pays-Bas finissent neuvièmes
avec Anouk, la Belgique est douzième avec Roberto
Bellarosa. | 18 mai — Le président français François Hollande
signe la loi sur le mariage homo. Les personnes de même sexe peuvent
se marier ensemble en France à partir de fin mai.]
Le deuxième paragraphe serait un peu difficile si je ne savais pas
de quoi il parlait, parce que le mot wet (qui
s'avère signifier loi) n'est pas transparent pour le
germanophone ou pour l'anglophone (si quelqu'un peut m'en donner
l'étymologie, d'ailleurs, je suis preneur), pas plus que la parenté
entre huwelijk (le mariage) et
l'allemand Ehe ; mais le reste est assez évident
quand on connaît l'allemand. (À ce propos, pour ceux qui lisent
l'allemand, je renvoie
à ce
document qui est très intéressant. Et en moins sérieux, pour ceux
qui comprennent l'allemand
parlé, ce
comique raconte de façon amusante l'effet que fait aux allemands
l'accent néerlandais.)
Il n'y a pas que le vocabulaire néerlandais qui est parallèle à
l'allemand : les structures grammaticales sont aussi très proches
(l'emploi de nombreuses prépositions, les verbes à particules
séparables ou inséparables, la formation des passés et participes, la
place des verbes dans les principales et subordonnées, la négation
par nicht/kein en allemand
et niet/geen en néerlandais,
etc.). Cela aide énormément, et il est assez clair que le statut du
néerlandais comme une langue à part plutôt que comme une variante du
bas-allemand est surtout une question de convention. Globalement, le
néerlandais a l'air un peu plus facile (il a fusionné deux des genres
de l'allemand en un genre
commun[#4] et il a à peu près
supprimé les cas), sauf peut-être pour ce qui est de sa prononciation
ou de son orthographe, qui ont l'air moins
systématiques[#5].
Mais qui dit proximité dit aussi risque de confusion, soit qu'il y
ait de faux amis (ou des différences subtiles de sens), soit qu'on ait
tendance à transposer spontanément un mot sans qu'il existe de l'autre
côté, soit, encore qu'on recopie bêtement le mot en oubliant que la
phonétique/grammaire n'est pas la même. Pour ce qui est des faux
amis, sans même parler de wie qui veut
dire qui en néerlandais alors que le mot allemand identique
signifie comment, j'ai déjà remarqué par exemple qu'en
néerlandais jawel veut dire si
(c'est-à-dire oui-en-réponse-à-une-question-négative) alors qu'en
allemand jawohl est simplement
emphatique ; klaar en néerlandais
signifie prêt, fini, alors qu'en
allemand klar
signifie clair ; even en néerlandais
signifie brièvement alors que eben en
allemand signifie il y a un instant ; et la limite entre les
verbes néerlandais mogen (avoir la
permission / aimer) et durven
(oser) est différente de celle entre les verbes
allemands mögen (se pouvoir
/ aimer) et dürfen (avoir la
permission / oser). J'aimerais trouver une liste de faux
amis courants, ça m'aiderait beaucoup.
Ceci dit, en fait, au niveau complètement débutant où j'en suis, ce
qui me perturbe plus, c'est que mon cerveau avait déjà créé une petite
case pour une langue germanique que je connais un tout petit peu,
qui n'est pas l'allemand, qui a deux genres grammaticaux (un neutre
plus ou moins associé à la lettre ‘t’ et un non-neutre), et dont la
prononciation est plus irrégulière que l'allemand, mais où notamment
la lettre ‘u’ se prononce souvent à peu près [ʉ], et c'est le
suédois. Entre autres, j'ai régulièrement envie d'utiliser le pronom
suédois de la seconde presonne du singulier du
(qui s'écrit pareil qu'en allemand, mais qui se prononce plutôt /dʉː/,
à peu près comme le même mot se lirait en néerlandais), alors qu'en
néerlandais
c'est je[#6].
[#] Je ne suis jamais
allé au Japon, mais je n'ai pas dit que je ne cherchais à apprendre un
minimum que des langues des pays où je mets les pieds.
[#2] Quand j'apprenais
l'allemand au lycée, je faisais des efforts très réduits pour le
vocabulaire, si bien que j'ai toujours une capacité d'expression assez
pourrie, par contre je prenais un plaisir infini à enchaîner les
propositions et les constructions alambiquées (quoi, vous avez
remarqué que j'aime faire des phrases longues et lourdes ?) et à
demander à mes professeurs dans quel ordre il faut mettre les mots à
la fin de Leute, denen hätte geholfen werden
sollen (=Leute, denen man hätte helfen
sollen). Et ce n'est rien à côté de ce que mes profs de latin ont
dû souffrir avec mes questions. (Par contre, mes profs de russe,
moins, parce que le russe se prête moins aux enculages de mouches
grammaticales : la réponse est presque toujours c'est comme ça, ce
n'est pas logique, et c'est tout.)
[#3] Sur 100 (je crois
que c'est une constante de la méthode Assimil que d'avoir 100
leçons) : on peut donc mesurer son progrès comme un pourcentage vers
un hypothétique niveau j'ai-tout-fini (où ils vous encouragent à
recommencer à zéro en cherchant à retenir plus activement), qui doit
correspondre déjà à un niveau de maîtrise non ridicule pour la plupart
des langues. Mais je ne compte pas aller jusque là pour le
néerlandais. Je me suis arrêté à 13% pour le suédois, 13% aussi pour
le japonais, quelque chose du même genre pour le hongrois, et 42% pour
l'arabe (ce qui, soit dit en passant, veut dire que je parle
considérablement mieux suédois qu'arabe, évidemment…).
[#4] Le
genre commun voulant donc dire masculin-ou-féminin, par
opposition au neutre. Mais comme un de mes amis me l'a fait
remarquer, le terme évidemment correct pour désigner
masculin-ou-féminin, le non-neutre, dans les langues qui ont cette
distinction, ce devrait être le utre,
puisque neutre, étymologiquement, c'est ne+utre,
c'est-à-dire ni l'un ni l'autre (du
latin uter, l'un
ou l'autre).
[#5] Et moins
standardisée, pour ce qui est de la prononciation : autant il existe
un standard à peu près clair de la prononciation de l'allemand (sans
exclure de nombreuses variations géographiques, bien sûr, mais une
sorte d'équivalent de la Received Pronunciation
anglaise), autant le néerlandais a l'air de ne pas admettre de
prééminence d'un accent sur les autres. Le ‘r’, par exemple, peut se
prononcer « à l'espagnole » (comme
une battue
alvéolaire), « à la française » (comme
une uvulaire)
ou « à l'anglaise » (comme
une spirante
alvéolaire), et ce n'est pas la seule lettre qui varie ainsi (le
‘g’/‘ch’, le ‘w’, le ‘v’ et le ‘z’ admettent aussi des variations
géographiques) ; les règles d'assimilation ont aussi l'air de varier
d'un endroit à l'autre (j'entends dire que certains néerlandophones ne
font même pas de distinction phonémique entre sourdes et sonores).
D'ailleurs, même la grammaire semble moins « standardisée » que celle
de l'allemand.
[#6] Ccomme
l'anglais you, dont le nominatif correct est
d'ailleurs ye, le néerlandais a repris un pronom
pluriel comme pronom singulier pour la seconde personne du pluriel ;
sauf que le néerlandais a aussi un pronom de
politesse u, et il a aussi un pronom
pluriel, jullie, construit sur le modèle
de y'all ou you guys utilisé
dans cette fonction dans certains coins des États-Unis ; comme en plus
le pronom singulier d'origine, gij, l'analogue
du thou anglais, a l'air de continuer à exister
dans certaines régions néerlandophones, tout ça fait beaucoup de
pronoms de la seconde personne pour une seule langue !
Je me passionne pour la phonétique un peu de la
même manière que pour la typographie : apprendre à reconnaître
précisément les sons que l'on entend ou que l'on prononce soi-même,
c'est un peu comme apprendre à remarquer les caractéristiques des
caractères écrits que l'on croise, c'est apprendre à développer son
sens de l'observation sur quelque chose qu'on a facilement tendance à
ignorer. (Cela peut devenir obsédant, d'ailleurs : comme Donald Knuth
le faisait remarquer, I can't go to a restaurant and
order food because I keep looking at the fonts on the menu — et je
ne peux plus m'empêcher de faire toutes sortes d'observations sur la
manière dont les gens parlent.) Et aussi bien pour apprendre à
reconnaître les polices de caractères que pour identifier ou
reproduire les propriétés phonétiques des sons du langage, il faut
« faire ses gammes », c'est-à-dire, s'efforcer de se familiariser avec
des points de référence standards : en typographie, les polices les
plus courantes (Times, Helvetica, Palatino, Futura, Univers, Optima,
etc.), et en phonétique, les sons de l'alphabet phonétique. Ici je
vais parler un peu de 18 sons de référence appelés les voyelles
cardinales.
La phonétique étant une discipline tout en nuances, ce n'est pas
aussi facile qu'on pourrait le croire de définir sans ambiguïté ce
qu'est une voyelle et une
consonne[#]. Il y a tout de
même une distinction concrète entre les unes et les autres, c'est que
les consonnes sont assez bien séparées les unes des autres (il y a un
ensemble assez discret de possibilités) tandis que les voyelles
forment un espace continu. Toujours est-il que je voudrais parler ici
un peu des voyelles.
Dimensions de l'espace des voyelles
La première question évidente est de déterminer la dimension de cet
espace des voyelles, c'est-à-dire le nombre de caractéristiques
indépendantes qu'elles peuvent avoir, un peu comme on détermine que
l'espace des couleurs est de
dimension 3. La réponse pour les voyelles est en plus de la
longueur et de la hauteur, encore 2 ou 3 dimensions, voire un petit
peu plus — l'incertitude vient du fait que certaines dimensions
sont plus « étroites » en ce sens qu'elles permettent moins de
variation, ou encore ne seront pas vraiment comptées dans la
caractéristique de la voyelle.
Les deux dimensions complètement évidentes, et que j'écarte
immédiatement, ce sont la longueur de la
voyelle (ou quantité de celle-ci, c'est-à-dire le temps
qu'elle dure) et sa hauteur (c'est-à-dire
la note sur laquelle elle est prononcée) : ces paramètres sont
importantes dans certaines langues qui peuvent contraster voyelles
brèves et longues, et/ou donner un sens aux tons (hauteurs ou
variations de hauteur). Ce qui reste quand on abstrait ses deux
dimensions, donc ce qui m'intéresse principalement, s'appelle
la qualité de la voyelle.
Les deux dimensions essentielles de la qualité des voyelles sont
l'ouverture et
l'avancement de celles-ci. Pour se faire
une première idée de ces dimensions, disons que l'ouverture de la
voyelle est ce qui distingue les mots français fi, fée
et fait (à supposer que ces deux derniers soient distincts) ou
encore fou et faux, voire folle si on omet la
consonne finale de ce dernier : dans chacune de ces deux séries
(fi/fée/fait d'une part
et fou/faux/fo[lle] de l'autre), l'ouverture est
croissante, c'est-à-dire qu'on a successivement une voyelle fermée,
mi-fermée et mi-ouverte ; pour ce qui est de l'avancement, on
contrastera fut et fou ou feu et faux ou
encore [coi]ffeu[r] et fo[lle] : dans chacune de ces
séries, on passe d'une voyelle antérieure/centralisée à une voyelle
postérieure.
Sur le diagramme standard servant à positionner les voyelles, et
que votre navigateur doit afficher à droite s'il supporte
le SVG, et qu'on
trouve sur
Wikipédia sinon, l'ouverture est figurée verticalement (la ligne
horizontale du haut correspondant aux voyelles fermées, la deuxième
aux mi-fermées, la troisième aux mi-ouvertes, la quatrième aux
ouvertes), et l'avancement est figuré horizontalement, avec à gauche
les voyelles antérieures et à droite les postérieures.
On sait bien que je suis fasciné par
la perception des couleurs, au
moins au niveau physique. Mais il y a un autre aspect de la
perception des couleurs, c'est l'aspect linguistique, et ses liens
avec les différentes formes de
l'hypothèse
de Sapir-Whorf (i.e., à quel point notre façon de désigner les
choses influence notre façon de les penser ou de les percevoir — ce
qui varie entre complètement évident et complètement faux selon ce
qu'on comprend exactement par là).
Une observation classique, qui a été explicitement formulée par
William Gladstone (le premier ministre de la reine Victoria, qui était
aussi un passionné d'Homère) est qu'Homère décrit les couleurs d'une
manière qui nous semble extrêmement bizarre : il décrit la mer, par
exemple, comme ayant la couleur du vin (οἶνοψ :
par exemple Iliade 23:143, Achille
regarde ἐπὶ οἴνοπα πόντον, sur la mer sombre
comme le vin), et en gros il n'utilise pas de mot pour bleu (il y
a deux occurrences à quelques vers d'intervalle dont la première
est Iliade 11:24, μέλανος
κυάνοιο, de bleu sombre, parlant de la tenue de bataille
d'Agamemnon, et ce n'est même pas sûr s'il parle vraiment d'une
couleur ou bien d'une matière ; de
même, Odyssée 7:87, θριγκὸς
κυάνοιο, une corniche de pierre bleue). Gladstone en avait
conclu qu'Homère, et peut-être les anciens Grecs en général, étaient
daltoniens, ou en tout cas ne percevaient pas les couleurs comme nous,
et que cette capacité avait évolué avec le temps. (C'est amusant,
d'ailleurs, quand on songe que la légende veut qu'Homère ait été
aveugle.) Mais du point de vue biologique, on peut dire avec
certitude que c'est faux : si je ne m'abuse, on sait que l'évolution
de la perception des couleurs, et notamment les dernières mutations
pertinentes de
la photopsine à
l'échelle de l'espèce humaine, sont beaucoup plus anciennes
que ça. [Correction () : en
fait, Gladstone ne pensait d'ailleurs pas ça ; ce qu'il a écrit en
1858, c'est I conclude, then, that the organ of
colour and its impressions were but partially developed among the
Greeks of the heroic age, mais il ne connaissait pas le concept de
daltonisme, et organ doit se comprendre comme une
faculté mentale. Cf. la vidéo de Raffaello Urbani liéee tout en bas
de ce
billet à partir de 12′28″ environ pour plus de précisions.]
Là-dessus est né
un certain
débat sur la manière dont les langues nomment les couleurs, avec
notamment cette thèse selon laquelle l'ordre est essentiellement
toujours le même : toutes les langues ont des mots pour le noir et le
blanc, puis, s'il n'y a qu'une couleur désignée c'est le rouge, puis
viennent le vert et le jaune (dans un ordre ou un autre), et le bleu
ne vient qu'ensuite. Je suis tombé
sur un
podcast qui évoque ces questions (même si leur façon de raconter
est, je trouve, assez insupportable) : ils font remarquer, ce qui
n'est pas idiot, qu'il n'y a pas grand-chose dans la nature qui soit
vraiment bleu — à part le ciel, mais, finalement, le ciel c'est
surtout du vide, ce n'est pas un objet, ce n'est pas forcément quelque
chose qu'on a idée de décrire ou de nommer par une couleur ; et que le
bleu est aussi une couleur difficile à synthétiser.
⁂
Pour défendre la version sapir-whorfienne des choses, on a invoqué
les Himbas de
Namibie, dont les mots pour désigner les couleurs recoupent assez mal
les nôtres. Il y a eu
un petit
documentaire de la BBC sur la perception des couleurs
(que je n'arrive pas à voir sur leur site, et dont la version sur
YouTube a été supprimée à leur demande, donc je ne peux pas vérifier
que mon souvenir est correct) où je crois qu'on voit des Himbas à qui
on demande quel carré de couleur parmi cet ensemble de douze est
différent des onze autres, où un carré est bleu et les onze autres
sont verts (de la même teinte exactement) et ils ont des difficultés à
répondre ; puis on leur repose la même question avec douze carrés
verts dont un est légèrement différent d'une manière qui nous semble
presque imperceptible et cette fois-ci ils répondent sans aucune
difficulté alors que nous aurions bien du mal. Ou du moins, c'est ce
que le film veut nous laisser croire : les choses sont un peu
embrouillées par le fait qu'il s'agit d'un film, donc d'une caméra qui
a filmé un écran d'ordinateur (sur lequel les carrés étaient projetés)
et dont la sortie a ensuite été comprimée, et il n'est pas acquis du
tout que ces techniques de reproduction+compression ne préjugent pas
du résultat en déformant les couleurs. Or je ne sais pas quelles
couleurs exactement ont été montrées aux Himbas. Si je
crois cet
article, d'où il ressort que les choses sont plus compliquées que
ça et dépendent aussi de la région du champ visuel utilisée, les
couleurs étaient peut-être les suivantes (modulo les variations de
rendu des moniteurs) :
D'un autre côté, j'ai un peu du mal à croire que le fait qu'un
carré soit ce que nous appellerions bleu et les
autres verts joue un rôle très important, parce que si je fais
la même expérience avec des carrés que nous qualifierions tous
de verts (mais avec une séparation chromatique qui est tout à
fait comparable, quelle que soit la définition exacte qu'on
prend),
je ne sais pas ce que les Himbas en penseraient, mais moi je ne
trouve ça ni plus facile ni plus dur que celui d'au-dessus. (Si votre
navigateur supporte l'API JavaScript canvas, vous
pouvez changer aléatoirement le carré de couleur différente en
cliquant sur l'image.) Du coup je suis un peu sceptique quant à toute
cette histoire.
D'ailleurs, il y a un type de sensations pour lesquels je crois
avoir une bonne faculté de distinction, ce sont les odeurs, et
pourtant je n'ai généralement aucun mot pour les désigner : du coup je
suis peu convaincu par les arguments du style on ne sait percevoir
que ce qu'on ne sait désigner.
⁂
Beaucoup de langues ont des mots bien différents pour désigner le
bleu clair et le bleu foncé : comparez d'une part ce que renvoie
Google images
pour le
russe синий
ou l'idéogramme
青, et d'autre part ce qu'il renvoie
pour le
russe голубой
ou les
idéogrammes 水色 [couleur de l'eau].
Je pense que même quelqu'un qui ne connaît aucune de ces langues
n'aura pas la moindre difficulté à reconnaître que les teintes sont
globalement différentes entre ces deux paires : il est donc évidemment
fumeux de prétendre que n'avoir qu'un seul mot pour bleu nous
empêche de voir la différence.
Bien sûr, le français a quantité de mots pour bleu : on peut
appeller turquoise ou cyan ou aigue-marine
ou céruléen telle ou telle variante plus précise de la couleur,
et évidemment beaucoup de langues ont une possibilité de raffiner
ainsi à l'infini. (Quand j'étais en lycée, j'utilisais des stylos
plumes de deux couleurs différentes : bleu effaçable et bleu
des mers du sud.) Mais la question qui se pose sans doute plutôt
est de savoir si une langue accepte ou non de désigner deux couleurs
sous le même nom : par exemple, en français, si je montre un objet
bleu et que j'insiste pour l'appeler vert on va me dire que je
me trompe, sauf peut-être si cet objet est d'un turquoise vraiment à
la limite entre les deux. (Est-ce que si je montre à un russe un
objet синий et que je le qualifie
de голубой il va tiquer autant que si je montre à
un français un objet bleu en disant qu'il est vert ?)
⁂
Il y a bien longtemps j'avais lancé
une expérience où je demandais aux internautes francophones qui
passaient par là de nommer par le premier nom, simple, qui vous
semble naturel (par
exemple rose, beige, gris…) une couleur tirée
au hasard dans l'espace sRGB linéaire. Voici les nuages
de points — projetés dans un triangle sRGB — pour
certaines des couleurs les plus fréquentes (le nombre entre
parenthèses est le nombre d'indentifications de cette couleur) :
Vert (1155)
Bleu (1011)
Rose (729)
Violet (475)
Jaune (300)
Gris (222)
Mauve (207)
Orange (176)
Beige (132)
Rouge (85)
Les couleurs figurées sur ces dessins eux-mêmes
sont là pour aider à visualiser, mais elles sont uniquement
schématiques, c'est juste un rendu approximatif que j'ai
choisi pour le nom en question : ces dessins pourraient aussi bien
être en noir et blanc, l'information pertinente c'est la région du
triangle où les points s'accumulent.
(Des douze couleurs les plus souvent nommées j'ai seulement omis le
blanc, qui avait fait 113 réponses, et le marron qui en avait fait
104, parce que ces couleurs me semblent dépendre trop fortement de la
luminosité pour être intéressantes dans le type de dessin que je fais.
Les termes suivants étaient : turquoise, cyan, kaki, brun, saumon et
magenta, avec respectivement 53, 36, 30, 24, 21 et 15
identifications.)
Une des choses qui m'avaient frappé est à quel point on nomme
rarement une couleur comme rouge : dès qu'elle vire un tout
petit peu vers le vert on la qualifie d'orange, et dès qu'elle vire un
tout petit peu vers le bleu on la qualifie de rose. Le rouge est
tellement précis qu'il en devient évanescent. A contrario, il
n'est pas surprenant que beaucoup de langues divisent en plusieurs
régions ce que le français appelle vert ou bleu, et qui sont de vrais
fourre-tout. Mais du coup, c'est peut-être encore plus surprenant que
le rouge soit la première couleur à émerger dans les langues
anciennes.
⁂
Bref, tout cela reste assez mystérieux, et il ne me semble pas
qu'on ait de réponse complètement satisfaisante à la question générale
de comment la langue influence notre perception des couleurs, ni à la
question particulière de pourquoi Homère évoque si peu la couleur
bleue.
Ajout
() : cette vidéo de Vox décrit assez bien toute cette histoire, notamment
l'hypothèse de Berlin&Kay sur l'universalité de l'apparition des
noms de couleurs (et certaines critiques qui ont été formulées contre
cette hypothèse).
Ajout
() : cette vidéo par Raffaello Urbani, démontant très
soigneusement et très méticuleusement le mythe selon lequel les Grecs
anciens ne voyaient pas le bleu (en passant par toutes ses facettes),
contient toutes sortes d'autres d'éléments pertinents sur le sujet de
ce billet, notamment une attaque du documentaire de
la BBC qui prétendait montrer que les Himba ne
distinguaient pas le vert et le bleu, et une réfutation de l'idée que
Gladstone aurait écrit que les Grecs étaient daltoniens.
Ajout
() : Ce long post de blog
(suite ici) par Aatish Bhatia (qui date de juin 2012 mais que
je ne découvre que maintenant) fait le tour la problématique évoquée
dans cette entrée-ci avec beaucoup plus de sérieux et de détails. Il
évoque lui aussi l'expérience avec les himba, et ajoute notamment la
précision que le résultat dépend du côté du champ visuel où se trouve
le carré de couleur différent (en simplifié, nos catégories de langage
affectent notre capacité à distinguer une couleur dans la moitié
droite de notre champ visuel, alors que ce n'est pas le cas dans
la moitié gauche).
Hier j'ai mangé avec
mes parents (mais sans mon
poussinet) au restaurant chinois La Merveille des
Ulis, autrement dit 旺德酒楼
(c'est ici).
Ce n'est pas trop mauvais, d'ailleurs, dans le genre buffet à volonté
assez varié.
Le petit jeu auquel je me suis livré, donc, c'est d'arriver à
reconnaître les caractères du nom chinois du restaurant, à partir de
la photographie que j'ai prise de la théière, sachant que je ne parle
pas un mot de chinois. La difficulté est, notamment, d'arriver à
trouver la clé des caractères et de compter correctement les
traits, alors que c'est complètement chinois pour moi, mais c'est
rigolo de se livrer à ce petit jeu de piste. Où il y a des pièges :
le caractère 酒 (jiǔ, la liqueur), qui
apparaît ici, est considéré avoir pour clé son élément de droite (le
vin), alors que le caractère 洒 (sǎ, arroser),
qui lui ressemble à un trait près a pour clé l'élément de gauche
(l'eau) ; remarquez que la confusion entre les deux doit frapper un
certain nombre de Chinois parce que
la recherche
dans Google de 酒楼 (les deux derniers
caractères de la théière), qui est manifestement une des façons de
désigner un restaurant, donne
encore un
nombre assez élevé de réponses si on remplace le premier caractère
par celui qui lui ressemble beaucoup.
Enfin bref, ceci me permet de savoir que le nom de mon restaurant
est quelque chose comme wonder restaurant : les
deux premiers caractères (wàng, qui désigne la prospérité, et dé, qui
désigne la vertu mais sert apparemment surtout dans des transcriptions
phonétiques) forment une transcription phonétique du mot
anglais wonder, la merveille. C'est un peu
ironique qu'un mot (merveille) utilisé parce que dans la tête
des Français il fait chinois (et c'est vrai qu'il doit y avoir
pas mal de restaurants chinois qui ont ce mot dans le nom, au moins
dans sa version française), soit rendu en chinois comme la
transcription d'un mot anglais ! (Il y a pourtant un bon mot chinois
pour dire ça, si j'en crois les dictionnaires : 奇迹, et la magie de Google images permet de savoir
que ce
dernier évoque des choses un peu différentes
de le wonder
transcrit, et j'aime l'apparition du durion pour celui-ci.)
Sans aller jusqu'à dire que j'ai un dialecte vraiment original du
français, la langue que je parle accumule un certain nombre
d'idiomatismes, de néologismes (l'emploi du mot idiomatisme en
étant lui-même un), de glissements
de sens, d'orthographes singulières, de marques d'activisme
typographique, bref, de petits traits personnels dont j'ai parfois —
mais pas toujours — conscience. Je ne parle pas du « français++ » qui
est une blague récurrente avec des amis que j'utilise pour désigner
toutes sortes de modifications que je serais tenté de faire à la
langue française pour la rendre plus logique ou plus agréable à mes
yeux, ou simplement pour m'amuser, comme le fait que j'y
ajouteraie [sic !] un subjonctif futur. Je parle de la langue que
j'emploie vraiment, ou du moins, de certaines des formes de langue que
j'emploie, parce que je ne m'exprime pas de la même manière dans un
mail à un ami, dans une entrée de ce blog, à l'oral, etc. Je ne
prétends pas être singulier (je veux dire, je ne prétends pas que mon
français soit singulièrement plus original que celui d'un
autre), mais j'aime me livrer à une petite introspection
linguistique.
Certains de ces traits sont à peu près involontaires : je fais
évidemment des fautes d'orthographe (sur l'emploi de ce mot,
voir ici : une faute est
précisément une bizarrerie dont je n'ai pas conscience et que je
corrigerais si je m'en rendais compte). Ou j'abuse de certains mots
et certaines expressions (parfois on me les signale, et parfois je
décide de faire un effort pour moins les employer) : mon poussinet
s'énerve, par exemple, de la fréquence avec laquelle je lui
dis éventuellement à des questions qui voudraient qu'on
répondît oui ou non (le éventuellement ayant pour
sens quelque chose comme pourquoi pas, je n'y suis pas foncièrement
opposé si tu veux faire ça, mais je ne suis pas enthousiaste non
plus, généralement accompagné de j'aimerais bien ne pas prendre
cette décision immédiatement). Je pense que j'utilise le
mot certes plus fréquemment que la moyenne, et je signale cet
exemple parce que je sais précisément d'où ça me vient, c'était mon
professeur d'histoire-géographique en classe de 3e qui
l'affectionnait.
Il y a des mots que j'emploie à dessein et qui sont jugés douteux,
incertains, ou d'orthographe incorrecte (ou juste vieillotte) par les
dictionnaires : soit parce que je trouve le terme plus précis, plus
heureux, plus correct étymologiquement, plus compréhensible, plus
juste, ou pour n'importe quelle raison plus agréable. Ou parfois sans
raison, mais en étant conscient qu'il s'agit d'une petite bizarrerie
personnelle. J'écris québecois et
pas québécois, referendum et
non référendum, événement et
jamais évènement, chausse-trape plutôt
que chausse-trappe, parfois mais pas toujours réglement
pour règlement ; je régularise le verbe arguer
en arguër et je n'aurais aucun scrupule à écrire que nous
arguöns ou même que nous avons arguë́ (j'avoue que là ça
s'approche un peu du français++). J'écris autant pour moi
juste pour énerver les gens qui insistent obstinément sur le au
temps pour moi. Parmi les néologismes ou quasi-néologismes, j'ai
déjà cité idiomatisme, décevamment (et toutes sortes
d'autres adverbes du même modèle dont je refuse d'admettre qu'ils
n'existent pas), confuser (j'assume complètement les
anglicismes qui corrigent une lacune du français). Dans les
bizarreries grammaticales, j'écris par exemple vus les résultats
déjà obtenus en accordant ce participe passé que la plupart des
grammairiens recommandent de garder invariable. Syntaxiquement, je
n'ai aucun problème à faire une phrase comme il est plus
vraisemblable qu'il ait été surpris que qu'il soit véritablement
choqué en préservant le double que que la logique demande
mais que des grammairiens, me semble-t-il, recommandent de simplifier
en un seul. Ah, et tant que j'y suis, je prononce [bɔnsaj] et pas
[bɔ̃zaj] pour les arbres miniatures de tradition chinoise et
japonaise : ce n'est pas la prononciation du ‘n’ que je souligne mais
la surdité du ‘s’, parce que, que je sache, le mot bonsoir ne
se prononce pas comme s'il s'écrivait bonzoir et il n'y a
aucune raison de faire une entorse à la fois à la langue française et
à la langue japonaise en inventant un ‘z’ dans bonsaï ; idem
dans Israël, d'ailleurs, qui n'est pas Izraël.
Ajouts : j'écris en-dessous (comme adverbe)
avec un trait d'union, pour la logique avec au-dessus, alors
que les dictionnaires prescrivent de l'écrire en deux mots ;
j'écris compte-rendu avec un trait d'union (et il fut un temps
où j'écrivais aussi court-métrage, mais j'en suis revenu ; je
me demande si je ne devrais pas pousser la logique jusqu'à
écrire trait-d'union).
Mais le plus grand ensemble de bizarreries de ma façon de parler
vient incontestablement du fait que j'importe beaucoup de vocabulaire
soit matheux soit geek (i.e., hacker Unix) dans le langage courant.
Souvent sans y penser : j'ai tellement l'habitude de m'adresser à des
gens dont je suis sûr qu'ils comprendront que je ne prête plus
attention au fait qu'il ne s'agit pas de français « standard ». Je
peux dire de deux idées qu'elles sont isomorphes pour signifier
qu'elles sont équivalentes dans leur structure ; je peux parler
de pinguer (pinger ?) quelqu'un au sens de demander
un signe de vie.
Parfois je ne sais vraiment pas si c'est compréhensible. Par
exemple, il est tout à fait courant, pour moi, d'utiliser le
mot modulo comme une préposition : son sens est quelque chose
comme en ignorant, à ceci près (par exemple : modulo
les incertitudes sur la météo) ou parfois, plus
abusivement, sauf (comme dans modulo erreur de ma part).
Je n'ai aucune idée, en vérité, de l'effet que produit l'audition de
ce mot sur un Français n'ayant pas eu de contact particulier avec des
matheux.
Et je passe sur des mots comme pipoter, crackpot, ou,
en fait, geek (celui-là semble devenu mainstream en français,
mais plutôt avec le sens de gamer, ce qui, du coup, est
problématique).
Bref, si vous ne comprenez rien à ce que je dis, c'est
certainement ma faute !
Idiomatismes, régressivité, et autres mots peut-être pas français
When I use a word, Humpty Dumpty said in rather a
scornful tone, it means just what I choose it to mean—neither more
nor less.
The question is, said Alice, whether
you can make words mean so many different things.
The question is, said Humpty Dumpty, which is to be
master—that's all.
(Lewis Carroll, Through the Looking-Glass,
chap. VI.)
C'est une discussion dans laquelle je me retrouve souvent engagé,
et qui recoupe des sujets sur lesquels
j'ai déjà ranté : en l'occurrence elle est partie de la question
de savoir s'il vaut mieux utiliser idiotisme
ou idiomatisme pour désigner une forme, construction ou
locution propre à une langue ou à un idiome. Je
défendais idiomatisme pour plusieurs raisons : c'est le mot le
plus logiquement construit pour correspondre à
l'adjectif idiomatique (et faire apparaître la racine
d'idiome), et, de fait, c'est ce qu'emploient spontanément la
plupart des gens qui ignorent que les grammairiens
recommandent idiotisme ; de plus, idiomatisme fait
parallèle à
l'anglais idiomatism[#0],
et loin d'être quelque chose à éviter, les anglicismes sont quelque
chose de souhaitable lorsqu'ils ne se font pas à l'encontre du génie
de la langue[#] mais contribuent
à internationaliser le vocabulaire
technique[#2] ; et a
contrario, idiotisme a un deuxième sens, qui est celui du mot
anglais correspondant, et qu'on lui comprend spontanément quand on ne
connaît pas le mot, ce qui peut causer des confusions indésirables
(j'ai dit cela par idiotisme est tout de même assez confusant).
Mon interlocuteur défendait idiotisme pour deux raisons : il
est plus fréquent, et surtout, idiomatisme ne serait pas un mot
français, ou serait une faute, preuve étant qu'il ne figure dans aucun
dictionnaire (sauf Wiktionary, qui ne compte pas). L'argument de la
fréquence est un argument pertinent, je ne le nie pas, je ne vais pas
m'étendre à ce sujet, disons juste que le rapport de fréquence ne
semble pas suffisamment écrasant pour qu'il suffise à écarter
complètement idiomatisme. C'est surtout l'argument des
dictionnaires que je veux rejeter avec beaucoup de force.
Je pourrais formuler ma réplique de façon
succincte : idiomatisme n'est pas dans les dictionnaires… et
alors ?
Je ne sais pas ce que ça veut dire qu'un mot ne soit pas un mot
français. Il y a des choses pour lesquelles j'en suis sûr,
évidemment, par exemple le mot zycofrène, parce que non
seulement il ne figure dans aucun dictionnaire, mais il n'apparaît pas
du tout sur le Web au moment où j'écris, on ne voit pas du tout quel
sens il aurait, il n'est pas formé de façon logique ou régulière,
bref, c'est juste une suite de lettres qui n'a rien d'un mot français
à part d'être correctement prononçable. Mais à partir du moment où un
mot est effectivement utilisé par des gens qui croient parler
français, que sa construction est logique et qu'on en comprend aisément
le sens, je ne sais pas quel sens ça a de dire qu'il n'est pas
français. Je peux prendre ça pour une définition (n'est pas
français un mot qui ne figure pas dans tel ensemble de dictionnaires),
mais dans ce cas la question serait : en quoi cette définition
est-elle utile ou pertinente ? ou en quoi cela me servirait-il de me
restreindre au français tel que défini par cette définition
extrêmement étroite (et qui m'interdirait à peu près tout vocabulaire
technique). La seule raison pour laquelle j'utilise, moi,
essentiellement des mots qui figurent dans le
petit Robert, c'est pour pouvoir être compris de mon
lecteur ou interlocuteur sans lui demander des efforts importants ou
sans lui causer de fatigue mentale — or je ne suis pas sûr
qu'utiliser idiotisme au lieu d'idiomatisme aille dans
ce sens. Pour moi, un dictionnaire n'est pas quelque chose de
normatif ou prescriptif, il n'a pas plus le pouvoir de faire la langue
qu'un manuel de biologie n'a le pouvoir de décider la façon dont les
cellules se reproduisent.
Et surtout, s'en référer à l'autorité d'un dictionnaire revient à
faire la même chose qu'un appel à une divinité pour évacuer un
problème de morale : on passe complètement à côté de la question qui
est, quel critère cette autorité doit-elle elle-même adopter
pour faire ses choix ? Car la langue, indiscutablement, évolue dans
le temps, et il faut bien admettre que des nouveaux mots apparaissent.
Je ne sais pas comment fonctionnent les éditions Robert
et Larousse pour choisir les mots
qu'ils ajoutent
chaque année à leur ouvrage. Plus exactement, je ne sais pas
comment ils font pour (1) repérer les candidats à rentrer, et
(2) choisir, parmi eux, lesquels entrent effectivement et lesquels
sont laissés à la porte (au moins jusqu'à l'an prochain). Ces deux
aspects me posent problème : le (1) parce que je me demande si c'est
fait de façon bien scientifique, en dépouillant systématiquement des
sources diverses (tels que : journaux, pages Web, Wikipédia, autres
dictionnaires) pour repérer tout ce qui n'a pas été considéré, et le
(2) parce que leurs critères ne semblent pas documentés de façon
claire, on a l'impression qu'il y a beaucoup d'arbitraire (et de
fait, Robert et Larousse ne semblent pas
vraiment faire les mêmes choix). L'exclusion du
mot idiomatisme s'est-elle faite au niveau (1) (parce que
personne n'a remarqué que des gens utilisaient vraiment ce mot) ou au
niveau (2) (le mot aurait été rejeté, et alors, pour quelle
raison) ?
Mon contradicteur me dit qu'il n'y a pas de raison d'admettre le
mot idiomatisme parce que le mot idiotisme existe déjà
avec ce sens-là (surtout s'il est plus fréquent). C'est un argument
qui est sensé, mais qui ne suffit pas. Pour le montrer, prenons
l'exemple d'un autre mot : géologiste. Est-ce là un mot
français ? Il semble être exactement dans la même situation
qu'idiomatisme : c'est un synonyme construit de façon vaguement
plus logique mais beaucoup moins usité qu'un autre mot de la même
famille, en l'occurrence géologue, et il fait parallèle à un
mot anglais (geologist) ; de plus, il ne figure
ni dans le petit Robert ni dans le
petit Larousse (du moins les éditions que j'ai sous la
main, mais je doute que ça ait changé), et pas non plus dans
le Trésor de la langue française
(TLF) (apparemment si, il était caché
sous géologue). Pas français, donc, géologiste ? Et
pourtant, celui qui croit à l'autorité des dictionnaires est obligé de
reconnaître que si, car le mot figure dans le Dictionnaire de la
langue française d'Émile Littré. Et même à l'époque de son
édition, il était moins fréquent que géologue puisque Littré
écrit synonyme peu usité de géologue : il faut donc
croire que cet éminent lexicographe a admis, malgré l'existence d'un
mot tout aussi valable de la même famille avec le même sens et plus
souvent utilisé, que géologiste pouvait être du bon français.
Alors pourquoi pas idiomatisme ?
Bref, il est de ces mots dont le fait qu'ils manquent à un
dictionnaire m'incite simplement à hausser les épaules et à dire et
alors ? ça montre juste que le dictionnaire n'est pas exhaustif.
Car lorsqu'un mot est construit de façon claire, que son sens ne fait
aucun doute à la lecture, qu'il ne paraît pas ridicule ou choquant (je
ne compte pas défendre la bravitude, par exemple), je ne vois
aucune raison de me priver d'en faire tout l'usage que je voudrai.
Par exemple, le mot régressivité ne figure, semble-t-il, dans
aucun dictionnaire : et alors ? c'est un mot français parfaitement
valable, c'est juste un oubli ou un manque de place, ou une décision
infondée, s'il n'est pas listé dans les dictionnaires. Il paraît
que furtivité était dans une situation semblable jusqu'à pas si
longtemps :
une décision
officielle le propose comme traduction de
l'anglais stealth, je ne sais pas si cette
décision pensait créer le mot ou en réutiliser un, mais je suis
fermement d'avis que ce n'est pas une invention. Le
mot perturbant ne figure pas non plus dans
le TLF (je veux dire, en tant qu'adjectif :
c'est bien sûr le participe présent du verbe perturber, mais la
question est de savoir si une idée perturbante doit être
approuvé), et n'a apparemment été admis par le
petit Larousse qu'en 2009, et probablement assez
récemment aussi pour le petit Robert : je refuse de
considérer qu'il s'agit d'un néologisme (comme blog, par
exemple, qui est indiscutablement un mot nouveau), il s'agit plutôt
d'une construction qui n'a été utilisée que très timidement et qui
s'est répandue, mais le mot a, à mon sens, toujours été français, même
si personne ne l'utilisait, parce que sa construction est évidente et
naturelle. Il en va ainsi d'idiomatisme,
de régressivité ou de l'adverbe décevamment (qui n'a
aucune raison de ne pas exister, et qui existe donc, même s'il s'avère
que personne ne l'utilise).
Les choses ne sont jamais parfaitement claires en matière de
langue. Évidemment j'ai conscience, quand j'utilise le
verbe confuser ou l'adjectif confusant, que je contribue
ainsi à faire évoluer la langue : c'est voulu, et je ne compte pas me
modérer, mais je reconnais que c'est un tout petit peu exagérer que de
dire qu'il s'agit de mots français tout à fait ordinaires — il y a
encore une aura, non de néologitude, mais d'inhabitualité, autour de
ces mots, et je ne les utiliserais pas dans un contexte de grande
solennité. Ce n'est pas tout à fait pareil que quand je
propose hétéroïne (pour désigner une femme hétérosexuelle,
c'est-à-dire le féminin de l'abréviation un hétéro), qui, lui,
est expressément construit et voulu comme un néologisme (plus ou moins
humoristique). Est-ce que hétéroïne est français ? Est-ce
que confuser est français ? Et qu'en est-il
de néologitude ou inhabitualité ? Je ne crois pas que
répondre à ces questions ait plus d'intérêt que de discuter du vocatif
d'ego ou du sexe des anges. La chose qui importe
est doit-on utiliser ces mots ?, et je vois assez peu de
contextes où on aurait la moindre raison d'éviter les
mots confuser, idiomatisme, régressivité, décevamment,
etc. (J'en vois un peu plus pour néologitude
ou inhabitualité et hétéroïne.)
En fait, la principale raison de les éviter est qu'on risque de
tomber sur des pédants qui vont se faire un plaisir de vous regarder
de haut en vous signalant qu'on ne dit pas idiomatisme, on
dit idiotisme (sous-entendu : je maîtrise mieux le français que
vous, pauvre idiot(e) capable de parler de bravitude). Si vous
expliquez après cela que, non, non, c'est voulu, vous pensez vraiment
qu'idiomatisme est meilleur, vous passez pour de mauvaise foi
(sous-entendu : je suis pris à faire une faute de français, et je
défends que ce n'est pas une faute en me raccrochant aux branches).
La solution, dans ce cas-là, c'est d'écrire à l'avance une
entrée dans votre blog expliquant votre choix, attendre
que archive.org la garde en mémoire, et pouvoir
dire ah non, déjà en novembre 2011, preuve à l'appui, j'ai montré
que je connaissais bien le mot idiotisme mais que je lui
préférais quand même idiomatisme. Dont acte. Bref,
retenez l'adresse de cette entrée pour pouvoir la ressortir à tous les
imbéciles qui vous reprocheront les différents mots zycofrènes que
j'ai cités.
[#0] (Ajout )
En fait, il semble que j'aie tort de penser que c'est par anglicisme
qu'on fabrique idiomatisme : le mot
anglais idiomatism est dans une situation tout à
fait analogue au mot français ; sauf que comme les lexicographes
d'Oxford sont plus facilement prêts à admettre des choses rares, il
figure dans le OED — mais il
figure avec des indications comme quoi il
est obsolete et rare, et en
fait c'est même un hapax (la seule occurrence trouvée est un texte de
l'académie de je-ne-sais-pas-quoi de 1771).
[#] Une loi jusqu'à
présent infaillible que j'ai constatée est que les gens qui prétendent
déceler des anglicismes pour les critiquer montrent, en fait, leur
ignorance du français, et on peut généralement trouver des exemples de
bons auteurs français ayant commis ce qu'ils croient signaler comme
une faute. (Parfois les gens ont des idées vraiment bizarre :
quelqu'un m'avait prétendu, par exemple, que l'usage du mot
français futur pour désigner l'avenir est un anglicisme, le mot
français correct étant, justement, avenir, le mot futur
étant réservé, selon lui, au temps grammatical, et à l'adjectif
éventuellement substantivé pour désigner le futur époux… je ne sais
pas où il était allé chercher cette idée aussi sotte que grenue.)
Même les anglicismes commis à dessein sont louables, tant qu'on a bien
conscience de ce qu'on fait : le mot implémenter, par exemple,
est calqué sur l'anglais to implement, et ceux
qui proposent de le remplacer par implanter n'ont visiblement
pas compris ce qu'il signifie. Je ne prétends cependant pas qu'il
soit souhaitable d'adopter en français toutes les bizarries de
l'anglais : il vaut mieux, par exemple, éviter
d'utiliser réaliser pour dire se rendre compte, car
c'est une bizarrerie de l'anglais que to realize ait ce sens
assez illogique vue l'étymologie, donc je préfère ne pas le transposer
en français.
(Éclaircissement :
Mon but n'est pas de dire que les gens qui utilisent réaliser
dans le sens de se rendre compte ont tort, ce serait vraiment
le contraire de toute ma thèse que d'affirmer ça ; mon but est
d'expliquer que ceci est un exemple de cas où moi, personnellement, je
m'abstiens.)
[#2] Je pense par
exemple à la terminologie mathématique : je trouve invraisemblablement
stupide d'accepter l'idée que positif en français
signifie positif ou zéro mais que positive
en anglais signifie strictement positif. Pour moi, il ne fait
aucun doute qu'il s'agit du même mot, et je trouve aberrant
de donner à ce mot un sens qui dépend du hasard de la langue dans
laquelle on s'exprime : dans ce cas précis, la solution est d'écrire
systématiquement positif ou zéro (positive or
zero) quand on veut parler de l'inégalité large, et strictement
positif (strictly positive) quand on veut
parler de l'inégalité stricte, et réserver le mot positif
(positive) aux cas où la distinction n'a aucune
importance. [Ajout : sur ce point précis,
voir cette entrée ultérieure.]
Ajout : comme on me le fait remarquer en
commentaire, je devrais lier vers cette
entrée ultérieure, qui est une sorte de suite de celle-ci.
L'écriture de l'entrée précédente,
en interlingua, et la lecture de quelques textes en interlingua
avant et après, m'a conduit à m'interroger sur l'usage et le sens des
temps grammaticaux entre les différentes langues, ou du moins entre
les seules langues que je maîtrise assez parfaitement pour avoir un
avis vraiment fondé sur un usage idiomatique, c'est-à-dire le français
et l'anglais (qui sont d'ailleurs toutes les deux classées par
l'interlingua comme des langues sources).
L'anglais a une riche moisson de temps grammaticaux (tellement
riche que la nomenclature pose quelque problème), fondée sur un usage
assez systématique des temps composés et surcomposés (il n'y a que
deux temps simples, le présent et le prétérit), et qui d'ailleurs
mélange des notions temporelles et des notions aspectuelles (pas que
je sois vraiment persuadé que la distinction ait toujours un sens ou
soit toujours pertinente) : he speaks
(présent), he is speaking (présent
progressif), he spoke
(prétérit), he was speaking (prétérit
progressif), he has spoken
(parfait), he has been speaking (parfait
progressif), he had spoken
(plus-que-parfait), he had been speaking
(plus-que-parfait progressif), he will speak
(futur), he will be speaking (futur
progressif), he will have spoken (futur
antérieur), he will have been speaking (futur
antérieur progressif). Je ne considère que le mode indicatif (quoique
là aussi, la dinstinction temps/mode n'est ni claire ni forcément très
pertinente), sinon il faudrait au moins ajouter : he
would speak (conditionnel), he would be
speaking (conditionnel progressif), he would have
spoken (conditionnel antérieur), he would have
been speaking (conditionnel antérieur progressif).
La liste semble cependant close : autant ces constructions
satisfont le logicien par leur côté systématique, autant on doit
avouer qu'elles ne sont pas si systématiques que ça : pour
tout temps grammatical T on ne peut pas former trois
nouveaux temps en mettant au temps T l'auxiliaire dans les
constructions be speaking, have
spoken et encore moins will speak, sinon on
arriverait à des temps comme *he is being
speaking (présent progressif progressif ?), *he
is having spoken (présent progressif
antérieur ?), he has had spoken (parfait
antérieur ?), †he is willing speak (présent
progressif postérieur ?), etc. : certaines de ces constructions sont
plus ou moins défendables (notamment le surcomposé he
has had spoken me semble assez correct, en fait), d'autres ne le
sont absolument pas (l'auxiliaire will, en fait,
n'est même pas vraiment un verbe, donc il est totalement impossible de
changer son temps en le remplaçant par be willing
ou quelque chose comme ça). Ceci étant, même dans les temps qui
existent sans aucune ambiguïté, en ajoutant une couche de voix
passive, on peut arriver à des choses aussi agréablement récursives
que words that will have been being spoken (le
futur antérieur progressif passif).
Le français, en comparaison, a quatre temps simples : il
parle (présent), il parlait (imparfait), il parla
(passé simple) et il parlera (futur) ; si on considère le
conditionnel comme un temps plutôt qu'un mode, il faut y
ajouter : il parlerait. Le Bescherelle, comme beaucoup
d'autres grammaires, n'admettent comme seule construction de temps
composé que la construction avoir parlé (c'est-à-dire
l'auxiliaire avoir, ou être selon les verbes, et
le participe passé). Ceci donne
les temps supplémentaires : il a parlé (passé composé), il
avait parlé (plus-que-parfait), il eut parlé (passé
antérieur) et il aura parlé (futur antérieur) ; et c'est tout
(et il aurait parlé pour le conditionnel passé, agrémenté de la
« seconde forme » inexplicable il eût parlé, qui est le seul
temps composé qui ne corresponde pas clairement à un temps
simple).
Cette analyse me semble un peu simpliste, d'une part parce que
d'une part on trouve occasionnellement, peut-être même plus souvent
qu'en anglais, des temps surcomposés (il a eu parlé, il
avait eu parlé, il aura eu parlé et peut-être il eut eu
parlé même si ce dernier fait un peu hu-hu), et d'autre
part parce que ça omet deux autres schémas de composition que sont le
passé récent et le futur proche : en effet, avec le verbe aller
ou venir de suivi de l'infinitif on forme des constructions qui
méritent, tout autant qu'avec aller (ou être) suivi du
participe passé, d'être qualifiées de temps composés : il va
parler (futur proche), il vient de parler (passé récent),
mais aussi il allait parler (qu'on pourrait qualifier de futur
proche antérieur, mais quand on n'y réfléchit, ce n'est pas très
logique par rapport à la différence entre futur simple et futur
antérieur, il vaudrait mieux le qualifier de passé prochement
postérieur) et il venait de parler (passé récemment
antérieur ?). Bizarrement, cela s'arrête là : on ne peut pas
mettre aller ou venir de à d'autres temps ; enfin, on
peut le faire, mais ça n'a pas le sens idiomatique d'une formation de
temps composé (il ira parler signifie qu'il fera un bout de
chemin pour parler, pas qu'il sera sur le point de parler ; on s'en
rend compte en essayant de mettre au passé puis au futur la
phrase tu arrives devant la porte, tu vas frapper : au passé
cela donne tu arrivas devant la porte, tu allais frapper et
pas tu allas frapper, et au futur on est obligé de dire quelque
chose comme tu arriveras devant la porte, tu seras sur le point de
frapper).
L'interlingua a trois temps simples : ille
parla (présent), ille parlava (passé, dont je
vais reparler dans un instant), ille parlara
(futur) ; on peut y ajouter un conditionnel, ille
parlarea. Mais à ce système de temps simples de richesse
intermédiaire entre l'anglais (2 temps simples) et le français (4
temps simples), il ajoute plus de schémas de composition que le
français ou que l'anglais : on peut former un temps composé comme en
français en conjuguant haber parlate (avoir
parlé, donc avoir plus le participe passé, et comme en anglais ce
sera toujours l'auxiliaire avoir qui servira), mais aussi comme pour
les temps progressifs de l'anglais en
conjuguant esser parlante (être parlant),
ou encore comme pour les temps proches du français en
conjuguant vader parlar (aller parler)
ou venir de parlar (venir de parler), même
si ce dernier n'est pas explicitement mentionné par les grammaires.
Et il n'y a pas de raison de limiter ces deux dernières compositions
comme le français le fait, donc on a 4×4=16 temps simplement
composés : ille ha[be] parlate (passé
composé), ille habeva parlate (passé
antérieur), ille habera parlate (futur
antérieur), ille es[se] parlante (présent
progressif), ille era [=esseva] parlante (passé
progressif), ille [es]sera parlante (futur
progressif), ille va[de] parlar (futur
proche), ille vadeva parlar (passé prochement
postérieur(?)), ille vadera parlar (futur
prochement postérieur(?)), ille veni de parlar
(passé proche), ille veniva de parlar (passé
prochement antérieur), ille venira de parlar
(futur prochement antérieur). Et il n'y a pas de raison de ne pas
surcomposer comme fait l'anglais, donc le he has been
speaking de l'anglais peut très bien se
traduire ille ha essite parlante, mais rien ne
dit non plus que la composition dans l'autre sens, ille es habiente
parlate (*he is having spoken), n'a pas
autant le droit d'exister. Cela fait une belle floraison de temps !,
qui n'a rien à envier à celle de l'esperanto, mais qu'il faut
probablement utiliser avec modération si le but est d'être
compréhensible et pas de s'amuser (encore que s'amuser est encore la
raison la plus valable d'utiliser des langues inventées).
⁂
Mais ce n'est pas tout de fabriquer des temps selon des règles
logiques, il faut aussi qu'ils aient vaguement un sens, ces temps.
Il est intéressant de comparer le français et l'anglais, parce que
l'usage des temps est relativement orthogonal. Il serait rigolo de
faire un tableau avec en ligne les 14 temps de l'anglais (ou plus si
on compte le conditionnel) et en colonne les 12 ou plus temps du
français, et essayer de remplir toutes les cases où on peut donner un
exemple assez naturel de contexte où on emploierait tel temps en
anglais et tel temps en français. Comme je n'ai pas le courage
d'essayer de remplir tout le tableau, je vais juste tâcher de
discerner un petit nombre d'usages communs, et pour les temps du
passé :
un événement ponctuel dans le passé, présenté dans le cadre d'une
narration : on utilisera alors typiquement le passé simple en français
(et alors l'oracle parla ainsi) et le prétérit en anglais
(and then the oracle spoke thus) ;
un événement durable ou répétitif dans le passé, ou dont la
terminaison n'est pas envisagée ou soulignée : on utilisera alors
typiquement l'imparfait en français (il aimait couper les cheveux
en quatre) et le prétérit en anglais (he liked to
split hairs) ;
un événement ponctuel dans le passé, rapporté au présent ou
comparé au présent : on utilisera alors typiquement le passé composé
en français (hier, j'ai parlé avec un grammairien fou) et le
prétérit en anglais (yesterday, I spoke with a mad
grammarian) ;
un événement dans le passé situé comme englobant un événement plus
ponctuel : on utilisera alors typiquement l'imparfait en français
(nous parlions ensemble quand tout d'un coup…) et le prétérit
progressif en anglais (we were speaking together,
when suddenly…) ;
un événement indéfini dans le passé, produisant des conséquences
présentes ou évoqué relativement au présent : on utilisera alors
typiquement le passé composé en français (j'ai parlé de grammaire
de nombreuses fois sur ce blog) et le parfait en anglais
(I have spoken many times about grammar on this
blog).
Ce ne sont que des catégories très grossières, je ne prétends ni
qu'elles soient très bonnes ou très bien définies, ni que dans chacune
de ces catégories on ne puisse pas trouver des cas où le temps choisi
sera différent, et je prétends encore moins avoir couvert tous les
cas. Mais en première approximation, c'est déjà quelque chose, et en
tout cas on voit bien que les temps français et anglais se recoupent
très mal. Et cela pose du coup la question, pour une langue inventée
comme l'interlingua, de savoir quel temps on utilise dans chaque cas.
Pour le cas 5, je n'ai aucun doute qu'on doive utiliser le passé
composé (io ha multe vice parlate de grammatica sur
iste blog), puisque le français comme l'anglais concourent dans ce
sens. Pour le cas 4, puisque l'interlingua a les temps progressifs de
l'anglais, on peut sans hésitation les utiliser (nos
era parlante insimul, quando subito…). Pour les cas 1 et 2,
j'utiliserais le passé simple (e alora le oraculo
parlava assi ; ille amava secar le capillos in
quatro), même si je suis inexplicablement gêné par le fait que ces
deux cas fusionnent (inexplicablement, vu que c'est le cas en
anglais et que ça ne me gêne pas). Reste le cas 3, où le français et
l'anglais ont une solution nettement différente : faut-il
écrire heri, io ha parlate con un grammaticario
folle, en imitant le français, ou bien, en imitant
l'anglais, heri, io parlava con un grammaticario
folle ? J'ai tendance à pencher pour le premier, parce que le
second signifie plutôt pour moi hier, je parlais avec un
grammairien fou (cas 4 ci-dessus), mais en fait, pour dire ça sans
ambiguïté, on peut très bien mettre : heri, io esseva
parlante con un grammaticario folle (de nouveau, comme en
anglais).
Bref, c'est le problème avec les langues inventées, il n'y a pas
d'idiome pour dire ce qu'on doit faire. Ce n'est pas vraiment un
problème : les ambiguïtés dont on parle ne sont pas bien graves (ce ne
sont pas vraiment des ambiguïtés, juste des hésitations sur
l'usage ; mais cf. ce que je racontais
ailleurs sur l'« atisme » et l'« itisme » en esperanto, il semble
que ça ait été une belle flamewar, pardon,
une flammilito). Mais j'ai quand même tiqué en
lisant ce
post de blog (écrit par un hongrois) en interlingua, auquel je
faisais référence dans la précédente entrée, parce qu'il écrit, par
exemple, io era presente a iste occasion e faceva
photos tamben (j'étais présent à cette occasion et j'ai aussi
fait des photos ; il s'agit en gros des cases 2 et 3 de ma
catégorisation ci-dessus) là où sous l'influence du français j'aurais
mis io era presente […] e io ha
facite.
Il serait intéressant de reprendre mes catégories 1 à 5 ci-dessus
(éventuellement enrichies ou corrigées s'il s'avère qu'elles sont trop
mauvaises) pour donner les exemples dans un maximum de langues pour
lesquelles la comparaison a un intérêt (probablement en gros les
langues indo-européennes). Pour ce qui est de l'allemand, j'ai
tendance à traduire par : (1) und dann sprach das
Orakel so (prétérit, donc), (2) ihm gefiehl
Haarspalterei (prétérit de nouveau), (3) gestern
habe ich mit einem verrückten Grammatiker gesprochen (passé
composé parfait), (4) wir sprachen zusammen,
als plötzlich… (prétérit) et (5) ich habe oftmals
von Grammatik auf diesem Blog gesprochen (parfait) — ce qui colle
plutôt mieux avec le français et mon
interprétation-française-de-l'interlingua qu'avec l'anglais — mais je
ne sais pas si mon intuition linguistique est fiable en la
matière.
Une autre question, évidemment, est de savoir si ça a un intérêt
quelconque d'avoir des temps verbaux plutôt que tout exprimer
par des adverbes. Mais ça c'est une polémique dans laquelle je ne
rentrerai pas (pour ne pas démolir les langues indo-européennes : je
les aime bien, moi, les langues indo-européennes).
Pote le interlingua realmente servir a communicar ?
Mi pullinetto es presentemente in Italia (a Roma). Ille non parla
le italiano, ergo si ille debe communicar con italianos, lo facera in
anglese. Que es tristissime : ille poterea comprehender le italiano
si illo serea parlate multo lentemente ; sed in senso inverse, le
italianos generalemente non comprehende le francese — de facto, illos
anque non ben parla le anglese. Il es alique absurde de utilisar le
anglese pro communicar inter gentes de linguas latin. Mi oncle, qui
parla perfectemente le italiano e qui va satis frequemente in Espania,
parla in italiano con le espanioles e illes le comprehende
globalemente ; etiam le espanioles pote parlar con le portugeses si
istes imita un accento espaniol. Sed si on cognosce solo le francese,
que facer ? On poterea parlar un sorta de pseudo-italiano o
pseudo-espaniol, sin se fatigar a apprender le conjugationes
(io parlo, tu parli, egli parla, noi parliamo, voi
parlate, essi parlano : proque non simplemente
semper parla ?). E illo, es exactemente que es le
interlingua.
Io non crede al possibilitate de successo del linguas inventate
(sin motivation politic forte). Sia nos realistic : nemo parla le
esperanto e nemo lo parlara unquam, le esperanto non es de alcun
utilitate pro communicar. (Io pensa anque que le esperanto es un
lingua nimis artificial e disagradabile :
vide iste
e ille
paginas Web pro saper proque. In omne caso, illo es difficile a
comprehender si on non lo ha apprendite antea : vos, lectores
francese, haberea probabilemente trovate mia
kokidetĉjo estas ĉi-hore en Italujo, li ne parlas itale, do se devas
komuniki kun italoj, ĝin faros angle minus comprehendibile que le
prime phrase de iste texto, mi pullinetto es presentemente in
Italia, ille non parla le italiano, ergo si ille debe communicar con
italianos, lo facera in anglese ; e pro un chinese, le duos es
equalmente 乱语.) Io anque non crede al
successo del interlingua como lingua mundial ; e de facto etiam minus
gentes lo parla (o simplemente cognosce su nomine) que le esperanto.
Il es desperate.
Sed como lingua commun inter populos latin, non es
completemente aberrante : le interlingua non pretende al
universalitate — e assi illo ha un avantage certe supra le esperanto,
es que multe gentes lo comprehende
spontaneemente[#]. Io
non pote parlar le italiano sin ser ridiculissime, sed io pote
parlar[#2] passabilemente le
interlingua (sin lo haber unquam vermente apprendite), como vos vide :
non es absurde de pensar que, parlante interlingua (o interlingua con
qualque parolas de italiano miscite), io serea melio comprehendite del
italianos que si io parlarea in francese o in porco-italiano o etiam
in anglese. Le ridiculo es certe, sed non plus que quando mi oncle
parla in italiano con le espanioles. (Le italianos pensarea
probabilemente que io parla in catalan o alique como isto.)
Io ha nunquam experite, sed si io haberea un amico italiano (o
espaniol, portugese, romanian…), serea satis natural de nos scriber in
iste lingua, post haber convenite de isto. Parlar assi a alcuno que
io non cognosce, forsan non (io es nimis timide).
OK, iste post era un experientia (e io jam ha facite
un tal : istac
e illac[#3])
pro saper : qui lo ha legite usque al fin ? E qui lo ha comprehendite
sin haber apprendite le lingua ? Scriber in interlingua es amusante
pro me, illo me dona un sentimento de libertate (proque le grammatica
non es nimis rigide : illo admitte frequentemente diverse
possibilitates equalmente correcte, on non va me dicer que io ha
facite multe « faltas », per
exemplo que istac non es un existente parola interlingual). Io
deberea essayar de scriber aliquando un fragmento
litterari gratuite in iste lingua.
[#] Etiam gentes qui
parla solo le anglese, apparentemente, e non un lingua latin (io non
lo credeva, sed io ha un testimonio in iste senso). Es probabilemente
multo plus difficile pro illes, sed non excludite.
[#2] Parlar,
scribeva io ? Scriber, certemente, sed parlar, de facto, io non ha
realmente experite.
[#3] Non es
impressive : il es gentes qui tene un blog integre in interligua
(como isto).
Je suis étonné de n'avoir apparemment jamais encore évoqué sur ce
blog un de mes sujets de râlerie de prédilection : la façon dont on
transcrit et translittère les langues étrangères. C'est-à-dire, la
façon dont on écrit en alphabet latin les mots ou les noms propres
d'une autre langue qui s'écrit naturellement dans un système
d'écriture non-latin.
La distinction entre les mots transcription
et translittération est normalement la suivante : le premier
signale que le processus a pour but de reproduire la
forme orale du mot transcrit (notamment pour donner des
indices à un locuteur non natif sur la façon de le prononcer), tandis
que le second a pour but de reproduire la forme écrite du
mot. Personnellement, je ne trouve pas cette distinction de
vocabulaire très utile, j'utilise transcription
et translittération de façon à peu près interchangeable, et je
vais tenter d'argumenter que dans tous les cas il faut se concentrer
sur la version écrite du mot (quoique, dans le cas de langues comme le
chinois ou le japonais, ce serait une version écrite elle-même
transcrite, en bopomofo ou en kana — mais c'est un cas plutôt
inhabituel) et privilégier un système qui permet de
retrouver exactement et algorithmiquement la version
dans l'écriture d'origine à partir de la version en alphabet latin.
Autrement dit, si on veut faire la distinction
entre transcription et translittération, je vais tenter
d'argumenter qu'on ne doit jamais transcrire et toujours translittérer
(sauf les langues idéographiques, mais je considère quand même qu'il
s'agit de translittération), et qu'on doit chercher autant que
possible à rendre la langue fidèlement.
Pour prendre quelques exemples, considérons le premier ministre
russe Владимир
Владимирович
Путин : son nom se translittère
de façon standardisée (ISO 9) comme Vladimir
Vladimirovič Putin (qui reflète fidèlement l'orthographe en
alphabet cyrillique), tandis que la transcription utilisée typiquement
en français, par exemple dans la presse, sera : Vladimir
Vladimirovitch Poutine (si ce n'est qu'en général on n'écrit pas
le patronyme), en écrivant tch pour donner une vague idée que
cela se prononce [tɕ] ou [tʃʲ], ou pour
marquer le son [u] comme en français, et en ajoutant un e à la
fin (qui n'existe absolument pas dans l'original) pour que les
Français ne soient pas tentés de transformer son nom en quelque chose
ressemblant à putain. Tout ceci est très peu systématique. Et
encore ai-je choisi un nom posant très peu de problèmes ; l'ancien
premier secrétaire du parti communiste
soviétique Никита
Сергеевич
Хрущёв est habituellement
appelé Nikita Sergueïevitch Khrouchtchev en français, et
officiellement translittéré Nikita Sergeevič Hruŝëv
en ISO 9 : ce qui est amusant, c'est que ni
l'écriture Khrouchtchev (qu'un français lit comme
[krutʃɛf]) ni celle Hruŝëv (que je n'ose pas
vraiment imaginer comment il lirait) ne donnent une idée de la
prononciation
de Хрущёв,
[xrʊˈʃʲːof]. C'est bizarre, notamment,
cette façon d'écrire ev alors qu'on prétend transcrire la
prononciation, qui est clairement of.
Un exemple en arabe, maintenant : tout le monde a entendu parler,
et très souvent ces dix dernières années, d'un mot qui en arabe
signifie la base, la
fondation : ألقاعدة
ou, avec les
voyelles, أَلْقَاعِدَةُ,
et qu'on transcrit comme al-Qaeda (ou peut-être
plutôt al-Qaïda en français). La translittération
officielle ISO 233-1
est : ʾˈalqaʾʿidaẗu avec les
voyelles, ou bien ʾˈlqʾʿdẗ sans
elles. Je conviens que c'est un peu excessivement psychorigide que de
suivre à ce point-là l'écriture arabe. Une translittération moins
maniaque et qui me semble néanmoins raisonnablement fidèle serait
quelque chose comme al-Qāʿidaẗ [ajout
() : en fait, c'est précisément la
translittération ISO 233-2, largement utilisée par
les bibliothèques en France, et elle me semble parfaite :
voir cette
fiche de la BNF par exemple, ainsi
que cette page
Wikipédia en français]. L'enjeu est
ici un peu différent du russe : pour le russe, la question est de
savoir dans quelle mesure on doit essayer (de façon bordélique et
incohérente) de mettre le lecteur francophone sur la bonne piste de la
prononciation ou au contraire refléter fidèlement l'orthographe en
cyrillique ; pour l'arabe, de toute façon la prononciation par le
non-initié sera sensiblement la même, il s'agit plutôt de se demander
si on doit écrire des signes en plus qui indiquent l'existence de
certaines lettres (notamment le ʿ pour transcrire la
lettre ع ou ʿayn, et l'astucieux ẗ, qui est
un ‘t’ tréma si vous ne le voyez pas, pour transcrire le
ة ou tāʾ marbūṭaẗ) ou la
distinction entre des lettres qui apparaîtraient identiques pour le
francophone (comme entre س et ص, sīn et
ṣād). Le fait est que le ʿ en arabe est une
consonne à part entière, et que le s et le ṣ n'ont rien à
voir : retirer ce genre d'information non seulement fait violence à la
langue (ce qui est quelque chose d'un peu abstrait), mais,
concrètement, embête très gravement les gens qui essaient d'apprendre
cette langue et qui ont besoin de cette information pour apprendre les
mots en question (évidemment ceux qui parlent déjà arabe arriveront à
retrouver ce qui est ainsi dénaturé) ; et ce, sans gain aucun, parce
que de toute façon quelqu'un qui voit un ʿ et ne sait pas
comment le prononcer va simplement l'ignorer comme si ce signe n'était
pas du tout là. Voilà pour quoi je fais attention à bien écrire les
prénoms ʿAlī ou Saʿīd s'il ne s'agit pas de
quelqu'un qui l'aurait francisé. Évidemment, la question de la
francisation se pose souvent, par exemple je ne suis pas certain qu'il
soit indispensable de parler de l'ʿIrāq (ou, en fait, du
coup, du ʿIrāq), ceci dit on n'est pas obligé de
dénaturer ça non plus en Irak alors que le ‘q’ ne choque
en rien la langue française.
L'argument maître que j'utilise pour justifier qu'on doit
privilégier le reflet fidèle de l'écriture (et donc, si on tient à
cette distinction, translittérer plutôt que transcrire) est ce que
j'appelle l'argument de Budapest et de Berlin. Car le hongrois et
l'allemand sont des langues qui s'écrivent en alphabet latin :
personne n'aurait l'idée d'écrire les capitales de la Hongrie et de
l'Allemagne autrement que Budapest et Berlin. Pourtant,
il n'aura échappé à personne que si on voulait donner l'importance à
la prononciation, on devrait écrire Boudapecht
et Berline. L'argument est donc : si on admet que, pour les
langues naturellement écrites en alphabet latin, on garde l'écriture
d'origine (y compris avec ses diacritiques, d'ailleurs) même si cela
conduit les Français à en faire une prononciation totalement fausse,
il n'y a pas de raison de ne pas faire la même chose pour les langues
écrites dans d'autres alphabets, c'est-à-dire, reproduire l'écriture
et ne pas se soucier de la façon dont les gens massacreront la
prononciation.
Bien entendu, les noms très célèbres se font naturaliser. Ce n'est
alors ni une transcription ni une translittération, c'est une
acquisition dans la langue : la capitale de la Pologne, en français,
s'appelle Varsovie, alors qu'il n'y avait pas de raison de ne pas
garder Warszawa (ou tenter de refléter la prononciation avec un
truc comme Varchava) ; de même, on a des noms spéciaux
pour Londres (London), Munich
(München), Anvers (Antwerpen), Florence
(Firenze), Lisbonne (Lisboa), Copenhague
(København), etc. Dans certains cas il est d'ailleurs possible
qu'une forme internationale du nom reflète mieux l'histoire ou
l'étymologie de celui-ci que la forme locale (qui n'est d'ailleurs pas
unique, certaines villes étant bilingues), ce qui est logique vu que
les mots s'abîment quand on s'en sert trop : on peut ainsi défendre
l'idée que Florence est un nom plus correct pour la ville que
la façon dont les Italiens l'ont massacré, ou que Cologne est
mieux que Köln (et pour ne pas que je laisse l'idée que ce sont
les Français qui ont toujours raison, il se peut très bien
que Marseilles, comme les Anglais l'appellent, soit mieux
que Marseille). Donc quand je parle de l'argument de Budapest
et de Berlin, ce ne sont pas tellement Budapest et Berlin eux-mêmes
(ces noms sont certainement naturalisés, même si ça ne se voit pas)
mais le fait que tous les noms hongrois, allemands, etc.,
célèbres ou obscurs, sont reproduits à l'identique, ou au pire sans
leurs diacritiques, quand on les utilise en français : on n'écrit
pas Charkeuzy pour essayer de rendre le patronyme de l'actuel
président de la république française, même quand on parle de son
père (nagybócsai) Sárközy Pál (dont on peut reconnaître que son
nom n'est pas francisé au fait que son prénom ne devient
pas Paul).
La position qui consiste à dire si c'est de l'alphabet latin, on
recopie, si non on transcrit la prononciation n'est pas seulement
incohérente et bizarre : elle donne des résultats loufoques si la
langue peut naturellement s'écrire en plusieurs alphabets. Va-t-on
s'amuser à donner du turc une transcription phonétique avant Atatürk
pour recopier l'alphabet latin après lui ? Va-t-on s'amuser à
transcrire phonétiquement le serbe depuis le cyrillique et à
reproduire le croate dans son alphabet latin d'origine, ce qui
pourrait donner au même mot ou nom deux écritures totalement
différentes ? Et une fois qu'on admet que le serbe doit se
translittérer en alphabet latin comme si c'était du croate, il semble
plus qu'étonnant de faire quelque chose de complètement différent avec
le bulgare ou le russe.
Quelle que soit la langue, le but le plus important doit être de ne
pas perdre d'information, ou d'en perdre le moins possible en
respectant la logique de la langue (et notamment, ne pas mélanger deux
lettres sous prétexte que les Français n'entendraient pas la
différence, si ces lettres sont bien séparées dans la langue
d'origine). En général, il existe des systèmes de translittération
standard qui accomplissent très bien ces buts, tout en restant
raisonnablement lisibles : ce
site donne un aperçu très complet de ce qui existe ; en général,
les standards de l'ISO sont bons en la matière
(ISO 9 pour le russe me semble
satisfaisant, ISO 15919 pour les langues indiennes
est très bon et d'ailleurs très largement utilisé ;
et ISO 233-1 pour l'arabe est un peu trop
illisible, mais on le rend beaucoup plus clair en
utilisant abusivement des notations comme ā, ī et ū pour
les voyelles longues au lieu des aʾ, iy et uw prévus par le standard
et qui reflètent rigoureusement l'écriture [ajout
() : en fait, en utilisant
justement ISO 233-2, cf. l'ajout ci-dessus]).
Reste le problème des langues utilisant partiellement ou totalement
des idéogrammes : dans ce cas il faut consentir à réduire
l'information de façon intelligente, puisqu'on ne peut pas décemment
garder chaque nuance des idéogrammes.
Pour l'ancien égyptien, il existe une réduction standard qui
préserve les signes unilitères, convertit les bilitères et trilitères
(et leur(s) éventuel(s) complément(s) phonétique(s)) en suite
d'unilitères, et omet purement et simplement les signes utilisés de
façon idéographique ou comme marqueurs de catégories : on peut alors
transcrire 𓇋 comme j (et son doublement 𓇌 comme y),
𓂝 comme ꜥ ou ʿ, 𓅱 comme w, 𓃀
comme b, et ainsi de suite ; et notamment, 𓄿 comme ꜣ,
un caractère assez spécial en lui-même (U+A723 LATIN SMALL LETTER
EGYPTOLOGICAL ALEF), que j'écris moi-même comme un chiffre 3, et qui
n'existe dans l'alphabet latin que pour translittérer le percnoptère
égyptien. Je crois que tous les égyptologues utilisent cette
translittération standard (dont je ne crois même pas qu'elle ait de
nom particulier), probablement pour minimiser le nombre de fois où ils
doivent effectivement dessiner des scarabées et des cobras.
Pour le japonais, il existe aussi une réduction standard, ce sont
les kanas, qui sont un syllabaire et qui reflètent la prononciation.
La difficulté n'est pas complètement close pour autant, car il existe
plusieurs façons de translittérer les kanas. La façon la plus
courante, qui s'appuie sur la prononciation réelle de ces kanas,
s'appelle
la transcription
Hepburn, tandis que la plus systématique, celle qui suit la
régularité du syllabaire,
s'appelle Nihon-siki
et est standardisée sous le nom d'ISO 3602 strict.
Cette dernière garantit qu'il n'y aura pas de perte
d'information[#] dans le passage
des kanas à leur translittération, et semble donc préférable ; elle
est aussi nettement plus logique, et si on imagine que le japonais ait
un alphabet, ce serait certainement dans selon les idées de ce système
de translittération : le fait qu'un ‘t’ suivi d'un
‘u’ se prononce de façon affriquée, un peu comme si
c'était ‘tsu’, serait certainement une règle de
prononciation non reflétée dans l'orthographe, et il semble donc
logique de translittérer tu (comme en Nihon-siki) et
non tsu (comme en Hepburn) pour つ, même si ce dernier
reflète mieux la prononciation. D'un autre côté, il est vrai que les
occidentaux se sont énormément habitués à voir le japonais transcrit
en Hepburn, et les défauts de ce système sont moins criants que le
non-système utilisé pour transcrire le russe.
[#] Hum, à lire la
description, j'ai quand même un doute : wikipédia semble dire que la
voyelle longue transcrite ‘ô’ en Nihon-siki peut
correspondre à l'allongement soit par un お soit par un
う, ce qui du coup casserait tout. Mais c'est bizarre
d'inventer un système suivant scrupuleusement les kanas et de le
casser juste sur ce point précis.
Pour le chinois mandarin, il n'existe pas de système d'écriture
naturel autre qu'idéographique, mais il existe un alphabet à des fins
d'éducation ou de documentation,
le bopomofo
(zhùyīn fúhào) qui reflète la prononciation (au moins dans
une large mesure), et un système de translittération en alphabet
latin,
le pīnyīn,
qui reproduit sans perte d'information l'écriture en bopomofo. Comme
il se trouve que c'est effectivement ce système qui est utilisé dans
la plupart des cas pour translittérer le chinois (hors des cas
spécifiques des mots qui ont été naturalisés, comme Pékin
ou Canton), je ne peux qu'exprimer ma satisfaction que, dans
une langue au moins, les choses aient tourné correctement. Du moins
si on fait l'effort d'écrire correctement les marques tonales sur la
translittération en pīnyīn, ce qui n'est malheureusement
pas toujours le cas (je fais la même remarque que plus haut pour
l'arabe : sans doute les gens connaissant bien la langue peuvent-ils
deviner les choses qui manquent, comme un francophone serait capable
de lire un texte en français où une lettre sur quatre aurait été
effacée, mais il faut au moins penser à ceux qui apprennent la langue
translittérée). On reproche parfois au pīnyīn de noter
‘b’ et ‘p’ des sons qui sont en fait tous les
deux sourds (la différence se faisant au niveau de l'aspiration), et
donc de donner l'idée fausse que le nom de la capitale chinoise
北京 (transcrite Běijīng) commencerait
par le son [b] alors que c'est un [p] ; je trouve que c'est un
reproche idiot : de toute façon les gens émettront des sons ayant un
rapport assez ténu avec ceux de la langue d'origine, il semble plus
important de reproduire les contrastes par des contrastes
ayant un sens pour eux (notamment entre ‘b’ et
‘p’) que les sons dans l'absolu.
☛ Pour résumer
(TL;DR), voici mes recommandations
concrètes pour choisir un système de
transcription/translittération :
chercher à privilégier autant que possible la forme écrite ou du
moins, si ce n'est pas possible, la forme écrite dans une écriture
secondaire plus ou moins phonétique (comme un syllabaire),
chercher à translittérer sans perte d'information, de façon
systématique et algorithmique,
chercher à refléter la logique (par exemple les parallélismes) de
la langue source dans la translittération,
abandonner l'idée de donner une indication utile sur la
prononciation, idée qu'on abandonne déjà pour les langues écrites en
alphabet latin (on essaiera cependant de ne pas
être inutilement absurde), mais chercher si possible à
reproduire les contrastes phonétiques par des contrastes phonétiques
vaguement analogues,
regarder du côté des translittérations ISO,
elles sont généralement bien faites.
Quand j'étudiais la grammaire à l'école quand j'étais petit,
j'étais toujours déçu de l'insistance mise sur la structure plutôt que
sur la sémantique. Pour prendre un exemple qui n'a pas de rapport
avec le schmilblick dont je vais parler après, si je dis dans la
rue, je viens de voir quelqu'un qui ressemble à un acteur
américain, cela peut vouloir dire deux choses : soit que ce
quelqu'un avait une tête générique d'acteur américain (à supposer
qu'il y ait des traits de visage caractéristiques des acteurs
américains en général), soit que je pense à un acteur précis, que je
ne nomme pas (peut-être n'en suis-je même pas capable) et qu'il
ressemble à cet acteur-là ; j'interprète cette différence, même si
c'est discutable, comme une ambiguïté sur l'article un, dont il
ne suffit pas de savoir qu'il s'agit d'un article indéfini, il
y a plusieurs façons d'être indéfini. Si on n'apprend pas aux enfants
à voir ce genre de subtilités, ils vont être tout perturbés de
découvrir que dans une autre langue, ces deux phrases se disent sans
doute de façon différente (en l'occurrence, je n'ai pas d'exemple en
tête de langue qui distingue bien les deux, même si en anglais on peut
jouer sur la distinction entre an American actor
et some American actor ; mais dans ma tête j'ai
vraiment deux sens très différents, et je pense que c'est important
pour l'apprentissage des langues).
Quand j'étais à l'école primaire et qu'on nous a fait un cours sur
la voix passive, avec un exemple qui ressemblait peut-être à le
veau est nourri par la vache, j'ai demandé à l'institutrice :
comment se fait-il qu'on n'analyse pas cette phrase comme un attribut
du sujet (sujet le veau, verbe est,
attribut nourri, complément du participe passé utilisé comme
adjectif par la vache) ? Elle a dû me faire la réponse que
font les adultes quand les enfants posent une question qui les
emmerdent, la pire réponse possible pédagogiquement : parce que
c'est comme ça. Pourtant, le problème que je soulevais sans le
savoir était un problème très intéressant, et elle aurait pu en
profiter pour me faire remarquer que la phrase française la porte
est fermée a deux sens bien différents, l'un dans lequel il s'agit
d'une phrase passive indiquant une action en cours (la porte est
fermée en ce moment par deux gardes armés, elle est en train
d'être fermée), l'autre dans lequel il s'agit d'un attribut
indiquant un état (la porte est fermée, elle n'est pas ouverte,
elle est peut-être même fermée à double tour et verrouillée). En
grammaire française, on analyse cette différence comme une différence
de structure (verbe passif versus attribut), mais en fait il serait
peut-être plus pertinent de s'interroger sur le sens du participe
passé.
La vérité est que le participe passé, en français, peut être trois
choses : passé actif, passé passif ou même, ce qui
est un peu ironique pour un participe qui se prétend
passé, présent passif. De plus, quand il a un sens passé, il
peut avoir le sens d'un passé d'action ou d'un parfait c'est-à-dire du
résultat présent d'une action passée (ce que j'appellerai l'ambiguïté
d'aspect, plus loin).
Une langue de grammaire de type indo-européen qui fait des
distinctions un peu fines distingue au moins quarte sortes de
participes : le présent actif, qui indique que le nom complété
accomplit l'action représentée par le participe, le présent passif,
qui indique qu'il la subit, le passé actif, qui indique qu'il l'a
accomplie, et le passé passif, qui indique qu'il l'a subie. Ceci est
très approximatif, bien sûr, pour plein de raisons : les temps peuvent
être relatifs ou absolus, par exemple (i.e., présent
signifie-t-il en même temps que l'action principale de la phrase ou au
moment où le locuteur parle ? je pense que pour un participe c'est
toujours relatif, mais je n'y mettrais pas ma main à couper) ; ce que
signifie accomplir ou subir une action n'est pas très
clair pour des actions sans complément et plus ou moins involontaires
(je prendrai l'exemple de tomber plus bas) ; et il peut y avoir
des complications dues à la confusion entre temps et aspect. Mais au
moins en première approximation, cette distinction est utile.
Un exemple de langue ayant la distinction
quadruple est le russe : si mes souvenirs de russe sont
corrects, лю́бящая
де́вочка (présent
actif) signifie une petite fille qui
aime, люби́мая
де́вочка (présent
passif) signifie une petite fille qui est
aimée, [по]люби́вшая
де́вочка (passé
actif) signifie une petite fille qui a aimé
et полю́бленная
де́вочка (passé
passif) signifie une petite fille qui a été aimée. Sauf qu'en
fait ces sens sont assez approximatifs : pour commencer, comme le
suggère le [по] entre crochets, je
glisse un peu de poussière sous la table, à savoir le fait que les
verbes russes existent sous deux aspects, appelés
l'imperfectif (qui envisage l'action pour elle-même) et
le perfectif (qui envisage le résultat de l'action) ; c'est
une question un peu byzantine de savoir si ce sont deux verbes qui
vont ensemble, l'un perfectif et l'autre imperfectif ou bien un verbe
qui a deux formes : toujours est-il
qu'ici люби́ть
est le verbe imperfectif
et полюби́ть
le verbe perfectif, que les participes présents actif et passif ne
peuvent se former que sur l'imperfectif, le participes passé passif
que sur le perfectif, et que le participe passé actif peut se former
sur l'imperfectif ou le perfectif (avec une distinction du
genre la petite fille qui aimait vs. la petite fille qui a
aimé) ; ce n'est ni très logique ni très satisfaisant pour
l'esprit ou l'orthogonalité voix/temps/aspect, mais c'est comme ça.
En plus, le participe présent passif a aussi un sens du genre la
petite fille aimable, et en l'occurrence surtout la petite
fille préférée. Bref, avec les langues, les choses sont toujours
Plus Compliquées®.
Une autre langue qui a la distinction quadruple
est l'esperanto : knabino amanta (présent actif)
signifie une petite fille qui aime, knabino
amata (présent passif) signifie une petite fille qui est
aimée, knabino aminta (passé actif)
signifie une petite fille qui a aimé
et knabino amita (passé passif) signifie une
petite fille qui a été aimée. Il y a aussi des participes futurs.
Sauf que, de façon plus surprenante pour une langue artificielle,
l'esperanto s'est lui aussi enferré dans des confusions temps/aspect,
ou peut-être temps relatif / temps absolu, sous la forme d'une
controverse entre l'atismo et
l'itismo ; pour faire bref, les atistes
ou temporistes ont la logique derrière eux et traduisent il
est né par li estis naskata,
litéralement il a-été étant-en-train-d'être-né, alors que
les itistes ou aspectistes ont Zamenhof derrière eux
(l'inventeur de la langue, qui ne s'est apparemment pas rendu compte
qu'il était illogique) et traduisent il est né
par li estis naskita, litéralement il a-été
ayant-été-né. L'académie de l'esperanto (oui, ça existe…)
a tranché en faveur des derniers, et de toute façon je ne suis pas
certain que l'esperanto puisse vraiment se targuer d'avoir un usage
vivant (s'il en a un, il utilise en fait d'autres constructions).
Le grec ancien a une pléthore de participes, parce
qu'il y a non pas deux voix (active et passive) mais trois (active,
moyenne et passive, la voix moyenne ayant en fait un sens actif mais
soit réfléchi soit accompli avec un sens d'intérêt pour soi-même, le
sens exact dépendant du verbe), et une multitude de temps (notamment
présent, aoriste et parfait, l'aoriste insistant sur l'aspect ponctuel
d'une action alors que le parfait insiste sur le résultat présent
d'une action passée). On a donc des choses
comme φιλοῦσα
κόρη (présent actif) pour une jeune fille
qui
aime, φιλουμένη
κόρη (présent passif) pour une jeune fille
qui est
aimée, φιλήσασα
κόρη (aoriste actif) pour une jeune fille
qui
aima, φιλησθεῖσα
κόρη (aoriste passif) pour une jeune fille
qui fut
aimée, πεφιληκυῖα
κόρη (parfait actif) pour une jeune fille
qui a
aimé, πεφιλημένη
κόρη (parfait passif) pour une jeune fille
qui a été aimée. Mais je ne saurais pas préciser les nuances très
exactes dans le sens de tout ça.
En latin l'éventail des participes est nettement plus réduit. On a
le participe présent, qui est un participe présent actif, et le
participe passé, qui est passé passif : amans
puella signifie la jeune fille qui aime tandis
que amata puella signifie la jeune fille qui a
été aimée. Je souligne bien ce sens passé et passif du
participe passé latin : amatus sum ne signifie
pas je suis aimé mais j'ai été aimé (pour je suis
aimé, c'est : amor). Il y a cependant des
verbes, dits déponents, qui se conjuguent avec des formes passives
mais un sens actif : dans ce cas, le participe passé a un sens
actif, locutus signifie ayant parlé, à
côté du participe présent loquens
signifie parlant (et pour ajouter à la confusion, il y a des
verbes semi-déponents, qui ont une forme active au présent et passive
au parfait, mais pour les participes dont je parle de toute façon ça
ne change rien par rapport aux verbes complètement déponents).
Le français dérive du latin, mais le sens du participe passé y est
beaucoup moins clair. Si j'écris abandonné par ses amis, il se
retrouve seul, le participe passé a un sens passé passif : le
personnage a été abandonné par ses amis, et je pourrais
rendre le sens passé passif plus clair en remplaçant par ayant été
abandonné par ses amis ; idem pour : ici repose Pat Icipe,
terrassé par la folie de la grammaire, où visiblement Pat a été
terrassé avant de reposer ici. En revanche, si
j'écris c'est un garçon au naturel charmant et aimé de tous ceux
qui le rencontrent, le participe a clairement un sens présent
passif (il est aimé de tous en même temps qu'il est au naturel
charmant ; soulignons d'ailleurs que rien ne changerait si je mettais
le verbe à l'imparfait, c'était un garçon…) ; idem
pour ébloui par la lumière, il ne voit pas ce qui l'entoure.
Ce n'est pas une question de verbe, mais de contexte : les pierres
traînées jusque là ont été disposées en pyramide est passé passif,
tandis que les pierres traînées jour et nuit sur de longues
distance finissent par s'abîmer est présent passif. Enfin, dans
beaucoup de phrases, on ne sait pas très bien si le sens est présent
ou passé : trahi par tous ses proches, il ne sait plus vers qui se
tourner (est-il ayant-été-trahi ou
en-train-d'être-trahi ?), criblé de balles, il s'effondre (les
balles le criblent-elles encore quand il s'effondre ? ça n'a pas
vraiment d'importance, en fait), enhardi par nos encouragements,
notre champion a triomphé de ses adversaires (l'enhardissement
est-il simultané ou antérieur au triomphe ?). À cette confusion sur le
temps s'ajoute une confusion sur l'aspect : la porte fermée la
veille ne peut pas être de nouveau ouverte marque une action
tandis que la porte aujourd'hui fermée à double tour ne peut pas
être ouverte sans la clé marque un état, qui est à peu près, mais
pas exactement, le résultat de l'action vue comme passée (la
différence est surtout frappante quand on observe la façon dont le
complément de temps la veille ou aujourd'hui
s'applique).
Ceci concerne essentiellement les verbes conjugués avec
l'auxiliaire avoir. Pour ceux qui utilisent être, le
sens du participe passé est encore différent, puisque cette fois il
est actif (ou plus exactement, il est dans la seule voix que
le verbe autorise, mais cette voix s'appelle normalement la voix
active, même si l'action est plus subie qu'agie) : dans la
phrase tombée par terre, la grand-mère ne peut se relever, la
grand-mère tombe par terre puis ne peut pas se relever, le participe a
donc un sens passé actif. Ces verbes sont en quelque sorte analogues,
sémantiquement, des verbes déponents du latin : le participe passé n'a
pas de sens passif. Il n'y a pas pour eux d'ambiguïtés sur le temps :
je ne crois pas que le participe passé français puisse jamais avoir un
sens présent actif (pour ça, il y a un participe présent). Pour
illustrer ce fait de façon frappante, je peux donner l'exemple du
verbe descendre, qui peut se conjuguer soit avec être
soit avec avoir selon le sens qu'on lui donne, ce qui permet au
participe descendu d'avoir : un sens présent passif dans la
phrase la poubelle descendue par Madame Martin lui échappe des
mains et tombe dans l'escalier ; un sens passé passif dans la
phrase la poubelle descendue le matin par Madame Martin n'a
toujours pas été vidée par les éboueurs ; ou un sens passé actif
dans la phrase descendue dans son jardin, Madame Martin profite
d'un moment de détente ; en revanche, pour un sens présent actif,
on utilise le participe présent : descendant dans le jardin, Madame
Martin tombe dans l'escalier et se blesse. En revanche, même dans
les verbes conjugués avec être, l'ambiguïté d'aspect subsiste :
comparer les phrases mon grand-père, mort aujourd'hui en fin
d'après-midi, était un homme bon et mon grand-père, mort
aujourd'hui depuis dix ans, est enterré au cimetière de
Montparnasse.
L'allemand améliore la logique et la clarté des choses, par rapport
au français, en donnant au participe passé un sens toujours passé (et,
comme en français, actif ou passif selon que l'auxiliaire régissant sa
conjugaison : ein gefallener Engel a le même sens
passé actif qu'en français un ange tombé) ; du coup, pour
construire le présent passif, on utilise
l'auxiliaire werden, dont le sens normal
est devenir : die Tür wird geschlossen,
littéralement la porte devient [ayant-été-]fermée, donc la
porte est en train d'être fermée (alors qu'en français on doit
utiliser cette périphrase en train d'être pour insister sur le
côté présent passif et non passé passif). Cela permet du même coup de
résoudre l'ambiguïté aspectuelle dans une phrase verbale (comme en
français) : die Tür ist [heute] geschlossen
indique que la porte est [aujourd'hui] dans l'état fermé alors
que die Tür ist [gestern] geschlossen worden (où
le verbe werden est lui-même utilisé au passé)
indique que la porte a été fermée [hier]. (En revanche, dans
le contexte d'une apposition, je crois qu'on ne peut pas faire cette
distinction : dans les deux cas, il s'agit de die
geschlossene Tür ; et théoriquement, die heute
geschlossene Tür peut signifier la porte qui a été fermée
aujourd'hui, die Tür, die heute geschlossen worden
ist, ou bien la porte qui est aujourd'hui dans l'état
fermé, die Tür, die heute geschlossen ist. De
même, lorsque le participe passé a un sens actif, on ne peut pas faire
la différence aspectuelle : er ist gestorben
signifie, comme en français, qu'il est mort ou bien qu'il est
mort.)
Ceci dit, même en allemand, je pense que par
exemple geliebt (le participe passé du
verbe lieben, aimer) peut s'employer dans un sens
présent passif, comme aimé en français : il est certainement
préférable d'écrire er wird geliebt
à er ist geliebt pour il est aimé,
mais meine geliebte Frau signifie, que je
sache, ma femme que j'aime (maintenant) et pas ma femme que
j'ai aimé par le passé. Donc même en allemand, la logique peut
parfois être sacrifiée au prix de l'expressivité de la langue.
Je prends comme exemple d'utilisation de Google images en
sémiotique une des citations sans doute les plus célèbres de Nietzsche
(fort appréciée des signatures sur Internet et, disent certains,
appropriée dans la guerre contre le terrorisme) :
Wer mit Ungeheuern kämpft, mag zusehn, daß er nicht dabei zum
Ungeheuer wird. Und wenn du lange in einen Abgrund blickst, blickt
der Abgrund auch in dich hinein.
(Jenseits von Gut und Böse, Aph. 146)
La traduction qu'on donne d'habitude en anglais (je ne sais pas
pour le français, je la vois surtout passer en anglais)
traduit Ungeheuer
par monster
et Abgrund
par abyss : He who fights with
monsters should look to it that he himself does not become a monster.
And when you gaze long into an abyss the abyss also gazes into
you.
Le sens, tel que je le comprends, est quelque chose comme : il faut
faire attention à ne pas devenir tel que ce que l'on combat ; à force
de s'obséder sur quelque chose, on finit par y ressembler. Mais
surtout, cette image de regarder profondément dans l'abîme, qui
regarde en retour, est incroyablement forte (on imagine presque
la porte de
l'enfer sous forme d'une tête monstrueuse, avec laquelle on croise
fixement le regard), et je pense que c'est la raison pour laquelle
cette citation a du succès. Mais si je
traduis Abgrund par abyss en
anglais et par abîme en français, ou si je
traduis Ungeheuer
par monster et monstre, est-ce que je suis
fidèle ? On peut évidemment discuter du sens fin du mot selon les
dictionnaires, et de savoir quelle est la distinction entre un abîme,
un précipice et un gouffre, en fait ce genre d'aphorisme fonctionne
surtout parce que les mots évoquent quelque chose en nous plus que par
leur sens exact. Or à ce moment-là, je ne suis pas convaincu : si
j'en crois le verdict de Google
images, Ungeheuer
évoque bien à peu près la même chose
que monster,
mais Abgrund
n'a pas la connotation aquatique ou sombre
de abyss
(même abstraction faite des affiches de films) ou même
de abîme
en français (pour la partie sombre, pas la partie aquatique qui serait
celle
de abysse).
Apparemment, Abgrund évoque le vertige
plus que les ténèbres de l'enfer. Était-ce le cas pour Nietzsche ?
Je ne sais pas. Je sais cependant qu'ailleurs
(dans Zarathustra), il compare l'homme
à ein Seil über einem Abgrunde, geknüpft zwischen
Tier und Übermensch (une corde au-dessus d'un abîme, tendue
entre l'animal et le surhomme), ce qui fait effectivement plus
appel à l'idée de vertige qu'à celle de ténèbre.
Autre question : Nietzsche pensait-il au psaume 42 (ou 41 selon la
numérotation) ? Je fais référence à cette
phrase : תְּהוֹם
אֶל
תְּהוֹם, que les
Septante
traduisent ἄβυσσος
ἄβυσσον
ἐπικαλεῖται,
et la Vulgate abyssus abyssum invocat ? Le sens
d'origine n'est pas extrêmement clair (la traduction œcuménique
de la Bible donne, pour le verset entier : Les flots de l'abîme
s'appellent l'un l'autre, au fracas de tes cataractes. En se brisant
et en roulant, toutes tes vagues ont passé sur moi.), mais
l'interprétation qu'on en fait généralement quand on cite la phrase,
par déformation ou contresens, est quelque chose comme : un mal
appelle un autre mal ; et à la fois ce sens et l'utilisation du
mot ἄβυσσος
par les Septante et la Vulgate font qu'il est tentant de relier ce
psaume à l'aphorisme de Nietzsche dans sa traduction anglaise. Je
pense que c'est une coïncidence ou une connexion faite plus tard,
parce que Luther utilise le mot Tiefe
(pas Abgrund), qui
évoque plus les profondeurs marines (comme les termes d'origine),
et il reformule la phrase (daß hie eine Tiefe und da
eine Tiefe brausen) en perdant l'idée qu'une
profondeur/abîme/abysse en appelle une autre et certainement
d'une manière qui exclut le contresens que je viens d'évoquer.
Ce que Google images nous apprend sur l'imagination collective
Un petit jeu auquel j'aime bien jouer avec Google images : prendre
un nom abstrait (mais n'ayant pas d'allégorie traditionnelle évidente)
ou un adjectif peu visuel, et essayer de deviner ce qu'il va en sortir
avant de faire la recherche. Éventuellement on peut ensuite jouer
à changer la langue —
cf. aussi ici. Par ailleurs, il
faut éviter les termes utilisés dans des titres de films, qui ont
tendance à un peu polluer les réponses (enfin, on peut dire que c'est
justement le jeu, mais je trouve que ces réponses-là ont tendance à
sortir un peu de la moyenne). Peut-être que c'est plus intéressant
avec des combinaisons de termes.
Parfois on voit très bien le genre de choses que ça va sortir, et
ça nous renseigne sur les clichés de notre culture collective : voyez
ce que
donnent evil, calm, holy, love
pour quelques clichés parmi les clichés. Il serait parfois bon de se
demander pourquoi, au juste, on
imagine l'avenir
comme ceci (trop de science-fiction ?)
ou la liberté
comme ça (la chose qu'on a envie de faire, quand on est libre,
c'est d'aller sur un bort de falaise au soleil couchant et d'étendre
les bras ?) ou
encore l'espoir
ainsi (une fois retirées les affiches de campagne d'Obama). Et il
serait bon de se rappeler que ces représentations sont vraiment le
fait d'une culture donnée à un moment donné. (D'ailleurs peut-être
qu'il serait intéressant de sauvegarder une compilation des résultats
des recherches d'images sur les cinq cents mots les plus courants de
la langue, pour les historiens du
Zeitgeist.)
Pour illustrer mon billet récent
sur les accents anglais et américain, j'ai tenté de me livrer à un
petit exercice pratique : j'ai choisi un texte assez approprié pour
l'occasion et j'ai essayé de le
lire avec un
accent Anglais (RP)
et avec un
accent américain (General American) (ce
dernier étant d'ailleurs plus naturel pour moi, même si j'ai forcé sur
les caractéristiques qui font la différence). Je ne suis pas très
doué pour ce petit jeu (et j'ai commis quelques erreurs), donc je
pense que je ne tromperais personne, mais ça doit pouvoir illustrer
plusieurs des phénomènes phonétiques que je décrivais (sauf,
malheureusement, celui que je qualifiais de plus évident, à savoir la
qualité du ‘a’ des mots comme bath,
parce qu'il se trouve qu'il n'y en a pas un seul exemple dans ce
fragment).
Je ne vais pas tenter de faire d'autres accents, parce que, outre
que le texte ne s'y prête pas, je suis vraiment encore moins compétent
pour imiter un accent écossais ou australien qu'un accent anglais
(même si j'aimerais beaucoup pouvoir, parce que j'adore les accents
écossais et australien ; à défaut, je vous renvoie
sur cette
dame, qui est quand même très douée). En revanche, il faudra que
j'essaie de faire lire un texte français avec un accent québecois, un
jour.
En fouillant dans votre genier, vous trouvez une vieille lampe à
huile poussiéreuse. Lorsque vous la frottez pour la nettoyer, un
génie en sort. Ce n'est pas un génie très puissant : le seul
vœu qu'il peut exaucer est celui de parler parfaitement une
langue étrangère. Par ailleurs, le génie ne sait pas très bien
combien de fois il pourra le réaliser, mais ce sera quelque part entre
1 et 15.
Autrement dit, vous devez lister 15 langues qui existent ou ont
existé (y compris des langues inventées, des dialectes, états
historiques, voire des accents précis si vous voulez griller une
cartouche avec ça), et le génie vous rendra capable de parler (et
comprendre, mais aussi lire et écrire) les n premières
d'entre elles, sans que vous sachiez à l'avance combien (l'intérêt de
cette hypothèse est d'obliger à faire un ordre de préférence ; si cela
a une importance pour votre réponse, vous pouvez considérer
que n est uniformément réparti entre 1 et 15 inclus). Vous
maîtriserez ces langues aussi parfaitement que si vous les aviez
apprises dès la naissance.
Évidemment, vous pouvez demander une langue que vous connaissez
déjà partiellement, mais en ce faisant vous gâchez peut-être un peu le
vœu en question (une meilleure stratégie est peut-être de citer
une langue proche mais différente, en se disant que parler
parfaitement cette langue proche vous aidera à la fois pour améliorer
la langue que vous connaissez parfaitement et pour en avoir une de
plus dans la liste) ; de même, il est peut-être du gâchis d'utiliser
un vœu pour maîtriser une langue facile à apprendre à partir de
celles déjà connues de vous (et de celles plus haut dans la
liste).
Personnellement, je considère que je parle français et anglais, et
je pense que mon choix serait quelque chose comme :
L'arabe classique. Parce que
j'ai essayé d'en apprendre un peu,
mais que j'ai abandonné et que je le regrette.
L'arabe classique parce que la grammaire semble en être la
plus intéressante (lire : compliquée), parce que ça permet d'écouter
ʾal-Ǧazīraẗ ou de lire les Mille et Une
Nuits en VO, et j'imagine que si on le connaît il
est ensuite plus facile d'apprendre tel ou tel arabe vernaculaire que
dans le sens contraire. Bref, s'il y avait une langue que je
devrais apprendre d'un coup de baguette magique (et
d'autant plus que je ne trouve pas le temps ou pas la
motivation suffisante pour l'apprendre par des moyens moins magiques),
ce serait celle-là.
Le chinois mandarin. Je n'éprouve pas la fascination pour la
culture chinoise qui semble être devenue courante, mais une langue
parlée par plus d'un milliard de personnes est indubitablement une
langue très importante, et quand elle a en plus une littérature
immense et un système d'écriture aussi vaste, elle ne pouvait pas ne
pas figurer en bonne place.
Le russe. Une langue que j'ai un peu apprise au lycée et que j'ai
ensuite soigneusement oubliée : que je connais suffisamment bien pour
savoir à quel point cela demanderait un effort démesuré de ma part
pour atteindre le niveau nécessaire pour lire ce que j'aimerais
pouvoir lire dans cette langue (ah, Pouchkine… ah,
Lermontov…). Bon, eh puis quelqu'un qui saurait parler
l'anglais, le français, le chinois, le russe et l'arabe (fût-il
classique) est quand même bien équipé pour parler avec une bonne
partie de la planète : j'écarte l'espagnol parce que ce serait griller
un vœu magique avec une langue décidément trop facile, et
je passe à des choses qui me sembleraient plus rigolotes.
Le suédois. Que je mets plus haut que l'allemand, par exemple,
parce que je parle déjà un peu l'allemand. Tant qu'à apprendre une
langue nordique, autant que ce soit la plus parlée. Au fait, je vous
ai déjà dit que j'adorais ce
webcomic ?
Le grec classique (dialecte attique). La langue (aussi apprise
autrefois et soigneusement oubliée depuis) avec laquelle j'aimerais
pouvoir frimer entre toutes. En plus, le génie me donnerait
exactement la bonne prononciation utilisée à Athènes en 405
avant l'ère commune.
Le japonais. Je ne sais pas bien où le placer sur la liste, mais
il devrait certainement y être, avec les autres langues que j'ai fait
une tentative pitoyable pour apprendre et que j'ai abandonnées parce
que je n'ai aucune volonté.
Le sanskrit classique. Pour l'intérêt philologique (encore qu'à
ce compte-là la forme védique est certainement préférable à la forme
classique), mais aussi parce que parler couramment sanskrit, c'est
quand même ultimement barbot. Alors tant qu'à choisir une langue
indienne, autant que ce soit celle-là.
Le gaélique irlandais. Je n'en connais rigoureusement rien, mais
les langues celtiques ont l'air d'avoir de très jolies sonorités, et
tant qu'à en connaître une, autant que ce soit celle qui est une
langue officielle de l'Union européenne.
L'italien. C'est délicat de décider où mettre une langue que
j'arrive à peu près à lire et à comprendre quand elle est parlée
lentement alors que je ne l'ai jamais apprise. C'est encore plus
délicat de décider si je mettrais l'italien ou l'espagnol (les deux,
je trouverais ça vraiment bête) : l'espagnol est indiscutablement plus
utile, mais je trouve quand même l'italien plus joli. Bon, les génies
dans les bouteilles, ils sont là pour faire plaisir, pas pour être
utiles, donc disons l'italien.
L'allemand. Une langue que je fais semblant de ne pas devoir
mettre beaucoup plus haut sur la liste sous prétexte que je la connais
déjà un peu, mais après mon voyage à
Berlin l'été dernier je devrais être plus modeste à ce sujet.
L'anglo-saxon. D'intérêt essentiellement philologique (même si,
là aussi, c'est certainement assez barbot de parler couramment
l'anglo-saxon) : il n'y a pas grand-chose que je voudrais lire dans
cette langue (la seule chose que tout le monde connaît, c'est Beowulf,
et, franchement, c'est plutôt chiant, même s'il faut avouer
que ça sonne
bien). Mais je ne vais pas mettre l'anglais dans la liste, alors
s'il y a quelque chose qui m'aide à mieux le parler et qui soit quand
même intéressant en soi, j'imagine que c'est l'ancien anglais.
Le latin classique (tel que parlé dans la haute société romaine en
l'an 27 avant l'ère commune). Que je mets si bas parce que c'est
désespérément banal, de parler latin. À ce stade-là, je me dis que si
je suis arrivé aussi loin dans la liste, j'ai eu bien de la chance
avec mon génie, et je peux arrêter les langues qui servent
essentiellement à frimer (certes, je pouvais citer l'ancien égyptien,
mais ce que j'en ai appris m'a surtout semblé ennuyeux, en fait).
Donc je finis en mettant trois langues choisies simplement pour le
fait d'être aussi différentes que possibles entre elles et de toutes
les précédentes (afin de m'ouvrir l'esprit au sens sapirwhorfien), en
étant parlées par un nombre raisonnable de gens dans le monde (et
aussi, en France) :
Le turc.
Le tamoul.
Le wolof.
Maintenant, je n'ai plus qu'à trouver le génie. En attendant,
j'attends les réponses de mes lecteurs (en commentaire ou sur votre
propre blog si vous en avez un).
Comment reconnaître une prononciation anglaise d'une prononciation américaine
Suite à ma lecture du livre de
Wells sur les accents de l'anglais, j'ai vaguement promis d'écrire
des choses sur la phonétique qui soient plus compréhensibles (ou en
tout cas moins spécialisées) que
la dernière fois. Alors voici
quelque chose de concret et même éventuellement utile : comment
reconnaître un accent anglais d'un accent américain ? Souvent c'est
évident même quand on ne parle pas bien la langue (et si ce n'est pas
l'accent proprement dit qui fait la différence, ça peut être le
vocabulaire utilisé : si un mot sur trois
est like, c'est probablement un Américain qui
parle). Mais quand la prononciation n'est pas caricaturale et si le
texte lui-même ne laisse pas de signe particulier, ça ne l'est pas
forcément ; ou bien, on ne sait pas exactement sur quels critères on
se fait une intuition. Alors voici un petit récapitulatif des
principales différences à remarquer :
La chute du ‘r’ non prévocalique. Je
mets ça en premier, parce que c'est le plus souvent signalé (pourtant,
bizarrement, beaucoup de gens ne sont pas au courant) : les Anglais ne
prononcent pas le ‘r’ quand il est devant une consonne ou
en fin d'énoncé (ou en fin de mot devant un mot commençant par une
consonne) — on dit qu'ils ont un accent
non-rhotique ;
les Américains, eux, le prononcent bien comme il est écrit.
Normalement, cela devrait fournir un critère simple : la personne
prononce-t-elle un ‘r’ dans les
mots part et sort ?
Prononce-t-elle farther différemment
de father, et tuner
de tuna ? Si oui, elle est probablement
Américaine ; si non, elle est probablement Anglaise. (Je suppose
qu'il n'y a que ces deux possibilités ; sinon, les Écossais et
Irlandais ont un accent rhotique, les Australiens un accent
non-rhotique.) En fait, ce n'est pas toujours si facile. Ce n'est
pas tant qu'il y a des exceptions dans les deux sens (en Angleterre,
les gens de Cornouailles ont traditionnellement un accent rhotique, et
aux États-Unis les accents de New York, Boston et du Sud historique
sont normalement non-rhotique ; en fait, ces deux phénomènes sont en
déclin, les accents tendant à s'uniformiser sur chacun des deux pays).
C'est surtout que le ‘r’ est un phénomène phonétique
complexe en anglais, qui « colore » les voyelles précédentes, de sorte
qu'il n'est pas toujours évident, pour qui n'a pas une bonne oreille
pour la phonétique, de savoir si un ‘r’ a effectivement
été prononcé ou simplement imaginé par l'auditeur. D'un côté, les
Anglais ne prononcent certainement pas neared
et need de la même façon (le ‘r’ est
certes tombé, mais il a transformé la voyelle en une diphtongue : ceci
ne se produit pas pour les voyelles de part
et sort, c'est la raison pour laquelle j'ai pris
cet exemple plus haut) ; de l'autre, les Américains « diluent » le
‘r’ sur la voyelle qui précède : si bien que dans les deux
cas, le ‘r’ est reflété comme un phénomène essentiellement
vocalique. Et les homonymies que j'ai signalées
(farther
et father, tuner
et tuna) sont finalement rares : il n'est pas
surprenant que la (non-)rhoticitié ne « saute pas aux oreilles », si
j'ose dire. Petite anecdote : un jour où j'étais à Londres avec mon
père, chez des amis anglais, nous voulions aller voir une pièce de
théâtre, et on nous a recommandé d'aller voir ce qui passait
au Shore Theatre ; du moins c'est ce que nous
avons entendu : un nom parfaitement raisonnable (et de fait, il existe
des théâtres de ce nom dans le monde, mais apparemment pas à Londres),
sauf qu'en fait nous n'avons pas trouvé parce qu'il s'agissait
du Shaw Theatre. Nos oreilles de Canadiens
n'avaient pas imaginé qu'il puisse y avoir confusion entre ces deux
mots : mais ce qui est étrange, c'est que la confusion s'est faite
dans ce sens-là et pas dans l'autre, c'est-à-dire que nous avions
inconsciemment interpolé le ‘r’ inexistant.
Le ‘a’ de bath.
Pour moi, c'est le signe distinctif le plus évident, le plus fiable,
et le plus simple à reconnaître. Il s'applique à des mots tels
que ask, fast, laugh, half, example, answer, can't
(ceux-ci sont probablement les plus courants : il y a des exceptions
dans tous les sens, mais il s'agit généralement de mots où le
‘a’ est suivi d'une constrictive sourde ou bien d'une des
séquences nt/ns/nʃ/nd/mpl). Les Américains les prononcent avec
le même ‘a’ que cat, tandis que les
Anglais utilisent une voyelle différente (avec la langue plus
reculée), qui est celle de father. Si vous ne
savez pas prononcer ces deux mots, et si vous faites parti des
Français qui continuent à distinguer patte et pâte,
c'est en gros la même distinction (mais plus prononcée) ; si vous avez
besoin d'un enregistrement pour comprendre, allez
sur cette
page et écoutez successivement les voyelles cardinales 4 (le [a]
cardinal, pas très loin de la voyelle notée [æ]
de cat) et 5 (le [ɑ] cardinal, pas très
loin de celui de father). Je pourrais aussi
évoquer les mots ant
et aunt, qui sont différents pour les Anglais et
identiques pour les Américains, mais dans ce cas précis il y a bien
des exceptions dans les deux sens (des Anglais
prononçant aunt avec la voyelle
de cat et surtout des Américains le prononçant
avec celle de father pour éviter l'homonymie).
En revanche, sur un mot comme ask, une fois qu'on
sait bien distinguer les deux ‘a’, ce qui n'est
franchement pas difficile, la distinction fonctionne quasiment à tous
les coups.
Le ‘o’ de lot.
J'ai déjà écrit en détail à ce
sujet, mais pour dire les choses plus simplement : la voyelle que les
Américains (sauf ceux de Nouvelle-Angleterre) utilisent comme
‘o’ « bref » (dans énormément de
mots : lot, hot, pot, God, top, Tom, solve,
et aussi watt, swan et
d'autres) est normalement un ‘a’ long, justement celui
de father dont je parlais ci-dessus. Certains
arrondissent un peu la voyelle, c'est vrai, mais cela reste bien
différent de la voyelle brève et peu surprenante (pas très éloignée du
‘o’ de sotte en français, même si elle est plus
ouverte) utilisée par les Anglais : on peut être assez sûr que celui
qui dit Gahd pour dire God
est Américain. Ou pour illustrer différemment ce phénomène en même
temps que le premier que j'ai signalé : le
mot part prononcé par un Anglais peut coïncider
presque parfaitement avec le mot pot prononcé par
un Américain (et les deux, d'ailleurs, se rapprochent du
mot pâte prononcé par un Français qui fait la différence
avec patte ; enfin, à la fois le ‘p’ et le
‘t’ sont différents, mais il y a quand même une certaine
ressemblance). Notons cependant que quelques mots utilisent un peu
inexplicablement une autre voyelle pour les
Américains : dog, notamment, n'utilise
généralement pas la même voyelle que God (il y a
aussi toute la série de cloth, avec un phénomène
semblable à bath mais inversé, mais je ne veux
pas rentrer dans trop de détails).
Le ‘oo’ de poor.
Il ne s'agit que d'une tendance, et elle varie selon les locuteurs et
selon les mots, mais les Anglais perdent de plus en plus le son
‘oo’ (de book) en faveur d'un simple
‘o’ (celui de shore
et Shaw) devant le ‘r’. Ceci est
particulièrement prononcé dans des mots
comme poor (qui devient homophone
de pore) et your ; le
mot sure peut devenir homophone
de shore et Shaw. C'est
moins frappant quand il y a un yod ([j]) implicite avant :
dans cure ou fury, on a
moins tendance à remarquer que les Anglais mettent un ‘o’,
mais c'est souvent vrai. C'est moins le cas quand il y a des voyelles
après (insurance a plus tendance à garder son son
‘oo’), mais cela arrive néanmoins, notamment dans certains
mots : quand Ricky
Gervais s'est
moqué du
film The
Tourist à son discours d'ouverture des Golden Globes 2011
(qui a été jugé parfois un peu trop provocateur par des Américains
coincés), en l'entendant j'ai cru que le titre du film était quelque
chose comme The Torist.
La chute des ‘h’. Même si ce n'est
pas considéré comme correct, les Anglais ont plus souvent que les
Américains tendance à omettre les ‘h’ initiaux (il me
semble en avoir remarqué dans le discours de Ricky Gervais signalé
ci-dessus, mais je ne retrouve plus) ; par exemple
prononcer happen
comme 'appen. Attention, je ne parle pas de la
perte du ‘h’ dans certains pronoms :
prononcer tell him comme tell
'im est standard et n'est pas un exemple de ce phénomène ; par
ailleurs, certains mots sont flottants même dans un usage standard :
ce sont les Américains qui ont tendance à perdre le ‘h’
de herb (en fait, historiquement, il n'était pas
prononcé : ce sont les Anglais qui l'ont ré-introduit ; de même,
historiquement, il n'y avait pas de ‘h’ prononcé
à habit, et il continue à ne pas y en avoir
à honour). Bref, ce n'est pas si simple. Pour
parler d'un autre phénomène concernant le ‘h’, on pourrait
aussi signaler que pas mal d'Américains font la différence
entre whine (prononcé avec [hw])
et wine (prononcé avec [w]), mais certains
Britanniques s'efforcent de la faire aussi, donc ce n'est pas si
discriminant que ça.
Le ‘t’ tapé américain. La
prononciation américaine du ‘t’ intervocalique, par
exemple dans un mot comme butter, est assez
particulière : ce n'est ni vraiment un ‘t’ ni vraiment un
‘d’ (il n'est pas certain qu'il y ait une différence
prononcée entre writer
et rider), c'est une consonne tellement brève
qu'elle ressemble à un ‘r’ comme on en trouve en japonais
ou en espagnol (noté avec un seul ‘r’). C'est un
phénomène assez discret, mais hautement caractéristique.
Les diphtongues avant schwa. Je mets dans ce
point un certain nombre de phénomènes un peu différents liés, dans la
prononciation anglaise, à la présence d'un schwa (la voyelle neutre
qui débute le mot alone, notée [ə] en
alphabet phonétique) après une voyelle et qui crée ou non des
diphtongues, ou modifie ou non des diphtongues. Pour un Américain, le
mot idea se prononce avec trois
syllabes : i-dee-uh (soit, en alphabet
phonétique, [aɪˈdiː.ə]) ; pour un Anglais, en
revanche, la succession du schwa représenté par la lettre
‘a’ finale après la voyelle représentée par la lettre
‘e’ a donné une diphtongue qui est la même que celle qui
correspond normalement à l'écriture eer :
donc idea a deux syllabes
([aɪˈdɪə]) et rime
avec deer ([dɪə]). De même, les
Anglais ont plus tendance que les Américains à mettre une seule
syllabe à real et à n'en mettre que deux
à theorem (qui rime alors parfaitement
avec serum). Pour un autre phénomène, prenons le
mot fire : la diphtongue [aɪ] représentée
par le ‘i’ devrait être suivie directement d'un
‘r’ : ceci est difficile, et aussi bien les Anglais que
les Américains ont tendance à interpoler un schwa (mais ils le
feraient moins souvent dans le mot fiery). Ceci
peut faire de fire un mot disyllabique, et
de hire et higher des
homophones parfaits. Ceci concerne les Anglais et les Américains,
disais-je, mais les Anglais plus que les Américains vont avoir
tendance à raccourcir les deux syllabes en une triphtongue qui peut
ensuite avoir tendance à devenir une simple diphtongue en perdant la
voyelle du milieu : donc de [ˈfaɪ.ə] disyllabique on
passe à [faɪə] avec triphtongue, et de là à [faə],
voire à [faː] ; le même phénomène se produit
avec tower que les anglais peuvent transformer en
[taə].
Les ‘r’ de liaison. Je finis par un
point qui est en quelque sorte le contraire et la conséquence du
premier : j'ai signalé que les Anglais perdaient le ‘r’
sauf devant voyelle. Quand deux mots se suivent, le ‘r’
final du premier réapparaît si le second commence par une voyelle.
Mais ce phénomène peut se produire par analogie même si le premier mot
ne comportait pas de ‘r’ muet mais aurait pu en contenir
un : il arrive donc assez souvent que les Anglais
prononcent I saw it avec un ‘r’ entre
les deux derniers mots, c'est-à-dire en faisant la même liaison que
dans for it. Ceci n'arrivera pas à un Américain,
pour qui le ‘r’ est mentalement vraiment un phonème.
[Ajout] Je devrais sans doute mentionner aussi un
certain nombre de shibboleth (shibbolot ?) célèbres, tels
que : schedule (prononcé
[ˈskɛʤuːl] aux États-Unis et
[ˈʃɛdjuːl] en Angleterre même si la
prononciation américaine y gagne du
terrain), issue (prononcé
[ˈɪʃuː] partout, mais parfois aussi
[ˈɪsjuː] ou [ˈɪʃjuː] par les
Anglais), kilometer (prononcé le plus souvent avec
l'accent sur la seconde syllabe aux États-Unis, et à peu près aussi
souvent sur les deux premières en
Grande-Bretagne), omega (prononcé avec l'accent
sur la première syllabe en Grande-Bretagne, et sur la seconde aux
États-Unis), ou encore la dernière lettre de l'alphabet
(prononcée zee par les Américains
et zed par le reste du monde, y compris les
Canadiens). Ceci étant, ces différences ne sont pas très
significatives, en fait : la raison est que les différences
systématiques tendent à se perpétuer, alors que les différences
anecdotiques de ce genre, surtout sur un mot un peu rare
(comme lieutenant) ne sont pas très
significatives puisque les gens entendent le mot peu de fois et
infèrent une prononciation à partir d'un petit nombre d'écoutes, pas
forcément naturelles : il suffit presque qu'une célébrité Américaine
ou Britannique passe à la télé et le prononce de telle ou telle façon
pour que ça puisse changer ; et de fait, pour toutes ces différences,
on peut considérer que les deux variantes existent des deux côtés de
l'Atlantique (et personnellement je mets l'accent un peu aléatoirement
sur omega, parce que j'ai parlé avec des
mathématiciens tant britanniques qu'américains, et au final je me
représente ça comme deux variantes également acceptables du même
mot).
J'ai tout récemment commencé la lecture de deux livres que je crois
déjà pouvoir recommander (il s'agit de nonfiction
— comment diable est-on censé traduire ça en français ? —
et du genre qu'on n'a pas spécialement de raison de lire dans l'ordre,
donc je ne les « finirai » peut-être pas vraiment, ou pas clairement,
ce qui m'incite d'autant plus à ne pas attendre ce moment hypothétique
pour donner mon avis).
☆
Le premier (que j'ai trouvé en flânant
chez W. H. Smith
dimanche soir)
s'appelle The
Evolution of God
(ISBN 978-0-349-12246-5[#]),
de Robert Wright. Il s'agit d'un essai sur
l'évolution[#2] des trois
grandes religions monothéistes, du concept de Dieu dans celles-ci, et
de leurs croyances de façon plus générale. Il ne s'agit pas à
proprement parler d'un livre d'histoire, mais plutôt d'un livre à
thèse, à mi-chemin entre l'histoire (de la pensée) et la philosophie
(de la religion), écrit par un auteur qui est probablement athée, ou
agnostique entre l'athéisme et le déisme sans confession ; les idées
qu'il expose paraîtront probablement choquantes à un Juif, Chrétien ou
Musulman très traditionnel, mais ne sont pas une attaque aussi
frontale que celles de Dawkins dans The God
Delusion : pourtant, je pense qu'elles sont bien plus
« dangereuses » pour ces religions, parce qu'elles explorent la façon
dont celles-ci sont nées et dont leurs préceptes n'ont pas toujours
été les mêmes.
Wright consacre un chapitre aux religions naissantes, un au
monothéisme juif, un à l'invention du christianisme, un à l'islam, et
un qui semble plus général et plus philosophique sur l'avenir des
religions. Je n'ai pour l'instant lu que le passage sur le
christianisme (j'ai commencé par là) et le début de celui sur le
judaïsme, mais ce que j'ai lu m'a beaucoup intéressé, et j'ai trouvé
le point de vue de l'auteur assez séduisant.
Concernant le christianisme, Wright cherche à reconstituer quelles
ont pu être les croyances du Jésus historique (sur le compte duquel il
expose quelque chose de pas incohérent avec ce que je
proposais ici
et là, d'ailleurs, même s'il ne
s'intéresse pas tant au personnage qu'à ses idées) et comment
elles ont ensuite été revues par les évangélistes et par Paul de Tarse
(aka Saint Paul). Il est assez convainquant, par exemple,
lorsqu'il explique que Jésus, dans le courant millénariste/messianique
juif, ne promettait certainement pas un paradis céleste
et après la mort mais la venue du Royaume de Dieu de son
vivant (ou en tout cas du vivant de ses disciples :
cf. Marc 9:1)
et sur Terre ; et que cette promesse a été revue et corrigée
(en faveur d'un paradis plus céleste, après la mort, et d'un Royaume
de Dieu plus symbolique) après évidemment le décès du prédicateur et
après que le Royaume de Dieu tardait décidément à se réaliser. Il est
aussi convainquant quand il défend l'idée que Jésus ne prêchait
certainement pas l'amour universel et l'égalité entre les hommes, mais
mettait clairement les Juifs en premier dans le Royaume de Dieu, les
Gentils n'ayant leur place que comme serviteurs qui ramassent les
miettes
(cf. Marc 7:25–29),
et que l'idée n'est venue aux Chrétiens que quand ils (notamment Paul
de Tarse) ont voulu cimenter cette religion et l'exporter aux
non-Juifs. Je ne rends cependant pas justice à Wright en résumant ces
thèses de façon aussi succincte. Je souligne que l'évolution qu'il
trace est celle des idées des premiers Chrétiens : il ne s'aventure
pas dans, par exemple, dans la théologie au Moyen-Âge, et évoque à
peine le Concile de Nicée — ce n'est pas le sujet qui le
préoccupe.
Concernant le judaïsme, son intérêt est d'étudier la façon dont le
royaume d'Israël est passé du polythéisme à la monolâtrie puis au
monothéisme, en inventant un dieu unique qui réalise la synthèse entre
des divinités telles
que El
et Baʿal
(l'un ayant défini le dieu de la bible tel qu'il est quand il est
nommé sous ce même nom, l'autre ayant influencé sa version sous le nom
de Yhwh). Là aussi, je trouve qu'il défend bien ses idées, par
exemple quand il signale le parallèle entre l'assemblée des dieux
évoquée
au Psaume 82
(81 en grec) et le conseil des dieux que préside le dieu El.
J'attends de finir ce chapitre et de lire celui sur l'islam pour me
prononcer plus complètement.
[#] Une question qui me
tracasse depuis un moment : quel lien « canonique » utiliser quand je
parle d'un livre ? Je n'aime pas trop en fournir un vers Amazon ou un
autre vendeur de ce genre, parce que je n'ai pas de raison de leur
faire de la pub ; il n'y a pas toujours de site Web officiel du livre,
et même s'il y en a un j'ai peur que ce genre de site soit moins
pérenne que mon blog ou que l'ISBN ; je fournis
généralement un lien vers le gadget-à-ISBN de Wikipédia,
mais je ne trouve pas celu-ci très pratique. Que faire, alors ? Je
me pose aussi un peu la même question pour les films, d'ailleurs :
jusqu'à présent j'ai adopté la politique de faire toujours des liens
vers leur entrée dans IMDB, mais je commence à me dire
que ce n'est pas forcément le plus neutre.
[#2] J'imagine que le
mot est choisi à dessein comme clin d'œil aux cinglés qui
rejettent les théories fondamentales de la biologie pour des raisons
religieuses.
★
L'autre livre (que j'ai reçu ce matin) n'a aucun rapport : il
s'agit d'un traité en trois volumes sur la prononciation de l'anglais
et de ses accents, Accents of English de
J. C. Wells
(ISBN 978-0-521-29719-6
pour le
volume 1, 978-0-521-28540-7
pour le volume 2,
et 978-0-521-28541-4
pour le volume 3). Ceux qui pensent que le sujet est aride se
trompent !
Je connaissais déjà J. C. Wells parce qu'il est aussi l'auteur de
l'excellent Longman
Pronunciation Dictionary
(ISBN 978-1-4058-8118-0
pour la 3e édition), que je recommande également très
vivement (c'est le seul dictionnaire que je connaisse à donner
fiablement la prononciation britannique et américaine, en l'occurrence
en alphabet phonétique, ainsi que de nombreuses variantes, et des
statistiques de préférences dans les cas où il y a des doutes).
Néanmoins, ce Pronunciation Dictionary
reste limité à la Received Pronunciation
anglaise et à la prononciation américaine synthétique connue sous le
nom de General American. Son
livre Accents of English ne se limite pas à
ça : il décrit soigneusement les différents accents britanniques (dans
le volume 2), mais aussi (dans le volume 3), les différents accents
américains, canadiens, australien, néo-zélandais, sud-africain,
indiens[#3] et plus.
Il serait facile de rendre la chose complètement illisible : devant
la masse de voyelles de l'anglais, et la masse d'accents qui existent,
on a vite fait de se perdre. Ce qui est remarquable avec le livre de
Wells, tel qu'il m'apparaît après un examen encore peu approfondi,
c'est qu'il arrive à faire la synthèse d'une masse de faits disparates
de façon qu'on s'y retrouve. Chose que je n'ai
probablement pas réussi à faire
dans une entrée récente de ce blog,
qui ne parlait pourtant que d'un tout petit groupe de voyelles !
Le volume 1 est introductif et peut se suffire à lui-même : il
présente la problématique générale, évoque la définition de ce qu'est
un accent et la manière dont ils diffèrent, puis il décrit les
accents standards Received Pronunciation
et General American et la façon dont ils
diffèrent, la phonémique (notamment des voyelles) et l'évolution
historique. Je pense que ce livre est très précieux pour quiconque
s'intéresse à la phonétique et veut apprendre à « parler l'anglais
correctement » (quoi
que correctement veuille
dire). Les volumes 2 et 3 décrivent ensuite en détail les accents
anglais de différentes parties du monde, comme je l'ai expliqué, avec
toujours beaucoup de soin (par exemple j'y trouve une explication très
claire et soigneuse du
fameux Canadian
rising qui fait que les Américains croient souvent,
complètement à tort, que les Canadiens
prononcent about comme ils
disent a boot).
[#3] Je mets des
pluriels un peu au hasard, puisqu'il n'est pas clair ce que signifie
le fait d'avoir un ou plusieurs accents dans un pays. Mais dans sa
section consacrée au Canada, Wells consacre une sous-section
particulière à Terre-Neuve, alors que pour ce qui est de l'Australie,
s'il mentionne évidemment des différences, il ne distingue pas une
région particulière.
I already wrote something
about English vowels versus
spelling, now let's concentrate on one small group of vowels
versus accents.
Let's start with an exercise for those who (think they) can speak
English: here is a list of words with a vowel underlined, you should
(without reading this entry any further or consulting a dictionary)
try to group the identical-sounding ones, i.e., decide how many
different vowels you can hear in this list and which words contain
which:
(Write down your answers and your doubts before reading any more of
this, so you won't be tempted to change them. Remember that only the
pronunciation matters: e.g., son and sun would be grouped
together if they appeared in the list.)
Now, what should be the answer? First, let's cross out the odd
word out: the vowel in brother does not sound like any
other in the list, it is the same vowel as
in son and sun and
also mother and other. I included this word as a
kind of control: if you think brother rhymes
with bother, then either English is not your native language,
or you are unaccustomed to noticing the differences between vowels, or
your variety of English is unusual and I'd like to know more about
it.
Other than that, everyone should agree with at least the following
identifications:
(‘ä’) father
and psalm have the same sound, and
generally palm also;
(‘är’) farther
and stark have the same sound;
(‘ŏ’) bother, cot, don, stock
and watt have the same sound, and
generally wash also;
(‘ŏr’) coral, forest
and horrid have the same sound;
(‘ô’) caught, dawn, law, Shaw, stalk, thaught
and thought have the same sound;
(‘ôr’) for, horse, morning, north, stork, war, warp have the same
sound;
(‘ōr’) courtforce, four, hoarse
and shore have the same sound, and
sometimes mourning also.
(I've used diacritics rather than IPA symbols for
these sets, because the actual phonetic realization can vary
considerably, as I will describe.)
If you make distinctions among these groups (say,
between cot and don), it's probably because your
ear is overfussy and cannot ignore the context. On the other hand,
I'm definitely not saying that there aren't any more
vowel identifications to be made than those described above: for
example, if you think father rhymes with bother, that's
fine (as I'll be explaining in a minute, most North American speakers
should say that). In fact, a sizable number of native English
speakers might even consider that all the vowels above (all
except brother, that is) have the same sound. And, as we
shall see, almost nobody distinguishes ‘ôr’ and
‘ōr’.
Now that we have distinguished seven groups of words, how do people
actually pronounce these vowels?
British English Received Pronunciation makes a
distinction between ‘ä’, ‘ŏ’ and
‘ô’: the vowel ‘ä’ is pronounced as the
long open
back unrounded vowel [ɑː], the vowel
‘ŏ’ is
short, rounded,
and slightly less open, [ɒ], and the vowel ‘ô’
is
long, also
rounded, and yet less open, [ɔː]. The essential
distinction is that of roundness: ‘ä’ is pronounced with
unrounded lips whereas ‘ŏ’ and ‘ô’ are
rounded. Also, ‘ŏ’ is breve whereas the other two
are long. The degree of openness varies (RP
‘ô’ is transcribed [ɔː], but it tends toward
[oː]), but this is probably less important. The variants with
‘r’ are pronounced exactly as those without and,
since RP
is non-rhotic,
there is generally no consonant to distinguish. So ‘ä’
and ‘är’ are identical (father and farther
are pronounced the same), and ‘ô’ and ‘ôr’ are
identical, and so is what we have written ‘ōr’
(caught and court or Shaw and shore are
pronounced the same); as for ‘ŏr’, it only occurs
with intervocalic ‘r’, so that it is pronounced,
but the vowel is otherwise the same as ‘ŏ’. Since I
know very little of other British pronunciations, let alone Southern
Hemisphere variants of English, I will now concentrate on North
America.
North American pronunciations typically merge ‘ŏ’
with ‘ä’ (except in a certain sense before
‘r’, see the end of this paragraph). So
American father rhymes with bother, both being
pronounced with a long open back unrounded vowel [ɑː] very
similar to the ‘ä’ of English RP. The main
exception to this is Eastern New England (and most
famously, Bawstawn, i.e., Boston) and Pittsburgh: in those
areas, ‘ŏ’ merges with ‘ô’ instead, both
being rendered as a long open back rounded vowel [ɒː]
(furthermore, since Eastern New England speech is partially
non-rhotic, con and corn are identical). Elsewhere, the
pronunciation of ‘ô’ varies quite a bit, but it is
typically more open than in British English: while it is transcribed
[ɔː], it could tend to [ɒː] (hence the
perception of Bostonian ‘ŏ’ as “aw”).
Before ‘r’, it tends to be closer (except where
‘ōr’ has survived, see below), so ‘ô’
and ‘ôr’ may not have identical vowels. Also before
(intervocalic) ‘r’, the vowel ‘ŏ’
(hence, ‘ŏr’) has become as in ‘ôr’,
except in the North-East where it is unrounded and identical to
‘är’.
In the Western part of the United States and the Northern Midwest
(and also Alaska, but excluding the San Francisco Bay area), and
pretty much all of Canada, the vowels ‘ô’ and
‘ŏ’ have also merged (this is
the caught–cot merger) when not followed by
‘r’: the resulting vowel is transcribed as
[ɑː], but it can be slightly rounded; this merger does not
take place before ‘r’, so while caught
and cot become identical, stark and stork do not
(they remain as [ɑːɹ] or even [aːɹ] for
‘är’ versus [ɔːɹ] or even
[oːɹ] for ‘ŏr’, ‘ôr’ and
‘ōr’, again with variations).
The distinction between ‘ôr’ and ‘ōr’
is lost in almost all varieties of English. Some isolated areas still
have it to some extent (e.g., Louisiana and Mississippi), in which
case ‘ōr’ is distinguished by the fact that it is
closer and/or partially diphtongized, as is the vowel
in toe or goat.
My personal story with regards to all of this is that I learned
English in Toronto, Canada, which has the caught–cot merger: so
I learned English with
‘ä’=‘ō’=‘ô’ all pronounced
as a slightly rounded version of [ɑː], whereas
‘är’≠‘ōr’≅‘ôr’=‘ŏr’
pronounced as [ɑːɹ] and
[ɔːɹ]/[oːɹ]. Because of this, I was
extremely confused: I could distinguish about three vowels in the
whole set, but the distinction I saw did not at all match the one
found in dictionaries! I occasionally entertain the idea of
revisiting my pronunciation of English and forcing myself to make a
maximal distinction in the set (pronounce ‘ä’,
‘ō’ and ‘ô’ all differently, though it
is difficult to do so in a way that is compatible with a generally
North American accent; and also pronounce ‘är’,
‘ōr’, ‘ôr’ and ‘ŏr’
differently). It is quite possible to change one's pronunciation and
to learn to make distinctions: I've done something of the sort in
French, and I now distinguish the ‘in’ and
‘un’ nasals ([ɛ̃] and [œ̃]) while
initially I did not. It's a good ear training exercise.
C'est un de mes sujets de logorrhée préférés, et je suis surpris de
n'avoir apparemment pas encore râlé à ce sujet sur ce blog :
c'est-à-dire pour dire du mal
des chieurs de l'orthographe et
— la pire race de cette déjà bien triste engeance — de la
typographie. Qu'est-ce qu'un chieur de l'orthographe ? C'est
quelqu'un qui est armé du Dictionnaire de l'Académie dans
une main et du Bon Usage de Maurice Grevisse dans l'autre
(et s'il fait partie des chieurs de la typographie, du lexique des
règles typographiques en usage à l'Imprimerie nationale,
vraisemblablement entre les dents) — je vous laisse transposer à
d'autres langues que le français — et qui tient à faire partager
sa passion pour ces textes et pour la sodomie sur les diptères avec le
même enthousiasme qu'un missionnaire baptiste à répandre la bonne
nouvelle et la frustration sexuelle. On les reconnaît au fait qu'ils
savent tout du pluriel des mots composés et qu'ils meurent d'apoplexie
à chaque fois qu'on suggère que les majuscules ne portent pas d'accent
en français (ou qu'on confond le mot majuscule
avec capitale, comme je viens de le faire à dessein). On les
reconnaît aussi qu'ils savent lire dans le Grevisse exactement comme
le baptiste dans la Bible : précisément ce qu'ils ont envie d'y
voir.
Trêve de sarcasme facile, mon but n'est certainement pas de dire,
pouah, l'orthographe, ça n'a aucune importance, chacun écrit comme il
veut, vive le langage SMS et d'ailleurs tout se vaut. Je
pense que le nombre de « fautes » d'orthographe sur ce blog est
relativement limité (et, en toute honnêteté, ça me chagrine toujours
quand on m'en signale, même si je me console en me disant qu'en tapant
au kilomètre comme je le fais et sans jamais me relire, c'est assez
inévitable). Je n'ai pas non plus la moindre intention de dire du mal
du Bon Usage, qui est un livre formidable et que je
recommande vivement.
Si certains ont du mal à cerner quelle est ma position, je pense
qu'on ne peut pas mieux la résumer que par ce slogan cher au
cœur du bon
vieux gourou d'Internet, et qui devrait s'appliquer à toute forme
de communication ou
d'échange : Be
conservative in what you send, and liberal in what you accept.
C'est-à-dire qu'il faut creuser un gouffre entre ce qu'on considérera
comme une faute chez soi-même et ce qu'on signalera comme faute chez
un autre ; qu'on doit garder les préceptes religieux par lesquels on
veut vivre pour soi, et ne chercher à imposer aux autres que ce qui
est strictement et évidemment nécessaire (tu ne tueras point a
l'air d'un bon début, reste à savoir à quoi cela correspond dans le
monde de l'orthographe). Il n'est pas interdit de signaler des
« fautes » aux autres, mais le ton est important : on doit le faire
avec la même diplomatie que si on signale à quelqu'un que l'on
soupçonne d'être peut-être un Juif pratiquant que ce qu'il s'apprête à
manger est un morceau de bacon.
Pour ce qui est de la typographie, il est le plus simple
d'expliquer ce qu'est une typographie correcte : la chose la plus
importante est d'être cohérent avec soi-même, de chercher à suivre
autant que possible les mêmes règles (et si possible, des règles
logiques) à l'intérieur d'un texte donné, voire d'un corpus donné. Il
faut évidemment que ces règles ne soient pas totalement étrangères à
ce que les gens ont l'habitude de voir, mais ceci n'interdit pas
d'innover (par exemple en matière de
ponctuation). La pratique la plus courante en français, par
exemple, veut que les ponctuations doubles (point-virgule, point
d'interrogation, point d'exclamation) soient précédées d'une espace
insécable fine que les maniaques appellent quart de quadratin
insécable, tandis que les deux points sont précédés d'une espace
insécable normale, et quant à la virgule et au point ils sont collés
au mot qui précède, toutes ces ponctuations étant par ailleurs suivies
d'une espace normale (et sécable) ; personnellement, je suis à peu
près ces règles, si ce n'est que j'utilise la même espace insécable
avant toutes les ponctuations qui en prennent une (je ne vois pas
pourquoi les deux points appelleraient plus de symétrie ou
d'espacement entre les deux propositions qu'ils séparent que le
point-virgule), et quand je tape dans une police à chasse fixe (par
exemple dans un terminal) j'utilise deux espaces après la fin d'une
phrase, comme il est relativement courant en anglais mais peu pratiqué
en français. Je dis tout ça pour signaler que je suis au courant de
beaucoup de règles de typographie et que quand et si je ne les suis
pas, c'est par une décision bien consciente, et les textes que je tape
ont en principe une certaine cohérence. Je m'impose à moi-même des
règles bien précises, et assez compliquées, dans l'usage des
guillemets par exemple (ou, quand je tape du HTML, pour
décider si je mets une balise <q> ou des guillemets
dans le texte ; ou d'ailleurs dans l'usage du HTML plus
généralement), et je ne cherche surtout pas à en faire la promotion :
je dois à mon lecteur que mon texte soit bien formaté, pas à
l'emmerder avec les règles quasi-oulipiennes qui président à ce
formatage. J'aimerais que cet état d'esprit fût un peu plus répandu !
Quant à l'Imprimerie nationale, elle a le pouvoir de faire des règles
pour elle-même, et de s'y tenir (ce qui n'est pas vraiment le cas,
d'ailleurs : j'ai remarqué que les (certaines ?) éditions
du Journal Officiel omettent systématiquement les accents
sur les capitales) : cela ne donne pas à ces recommandations internes,
et d'ailleurs elle ne le prétend pas, la moindre portée en-dehors de
l'Imprimerie nationale. Personnellement je suis en désaccord avec un
certain nombre de leurs choix, mais je ne vais certainement pas en
discuter ici.
S'agissant de l'orthographe, la chose qu'ont le plus de mal à
admettre les puristes de l'orthographe, c'est que, quand il y a un
doute, c'est qu'il y a plusieurs orthographes correctes pour
la même chose. Rien ne dit qu'un mot donné, ou une forme grammaticale
donnée, ne doit avoir qu'une seule écriture possible, et, à la limite,
tant qu'on ne cause pas
d'ambiguïté, plus
il y en a mieux c'est. Il est ironique de voir combien souvent on
cite le Bon Usage pour justifier une règle : or
le Bon Usage, justement, adopte une attitude tout à fait
louable face à n'importe quelle difficulté, c'est de recommander
mollement un choix possible, de l'illustrer par quelques citations de
bons auteurs, mais de montrer ensuite par d'autres citations de non
moins bons auteurs que d'autres possibilités ont été préférées par ces
derniers. Grevisse n'est pas normatif, il est descriptif : il donne
des conseils et non des lois, et il excelle à montrer que la langue
n'est pas rigide, que toutes les règles sont souples et que les
meilleurs écrivains ont pu décider de les ignorer. Quand un emmerdeur
vous renvoie au Bon Usage (§1137(a), 1º) pour vous
signaler qu'en bon français après que est suivi de l'indicatif,
vous pouvez ouvrir ce livre et constater qu'il vous donne les moyen de
lui rétorquer qu'avec Sartre, Montherlant, Camus, Aragon, Butor,
Robbe-Grillet et d'autres, il est en bonne
compagnie ; personnellement, je préfère utiliser
l'indicatif après après que, mais je ne relève pas le
subjonctif comme une « faute » — c'est une hésitation
de la langue, comme il y en a beaucoup, et chacun est libre de se
former son propre style.
Proposé-je que la notion de
faute d'orthographe n'existe tout simplement pas ? J'ai, en fait, une
philosophie très simple : dès lors que celui qui parle ou
écrit est conscient de ce que recommandent généralement les
grammairiens (c'est-à-dire qu'il connaît la règle, ou les hésitations
au sujet de la règle, et qu'il y pense au moment où il s'exprime), et
qu'il choisit en toute connaissance de cause la forme qu'il
utilise, alors il ne peut pas y avoir de faute : on a
éventuellement affaire à une licence de langage, à une innovation, à
un néologisme voulu, à une tentative pour réformer la langue, mais pas
à une faute. Dès lors, personne n'a d'autorité pour décider de
l'orthographe d'un mot que celui qui l'écrit, s'il est bien informé.
L'erreur a lieu quand on est distrait ou oublieux, ou ignorant d'une
règle qu'on eût choisi de suivre si on l'eût connue. Quand faut-il
signaler une erreur ? Quand on pense que cela rendra service :
c'est-à-dire quand la personne à qui on s'adresse voulait probablement
suivre une certaine règle et l'a oubliée par maqnue d'attention (par
exemple, si j'ai écrit maqnue au lieu de manque, je
n'étais probablement pas en train de chercher à réformer
l'orthographe, mais je me suis simplement emmêlé les doigts en
tapant… autant pour moi) ; c'est déjà plus délicat quand on
soupçonne que la personne voudrait suivre une règle si elle
la connaissait mais ne l'a jamais apprise (mais en général, si un mot
s'écrit de telle façon dans absolument tous les dictionnaires français
et que quelqu'un l'orthographie autrement, il y a fort à parier que ce
n'était pas volontaire et qu'il ignorait simplement l'orthographe
préconisée pour ce mot).
Globalement, en fait, on reconnaît le maniaque à ce que ce sont
certaines « fautes » très spécifiques, et extrêmement mineures, qui le
font réagir : ils peuvent reprendre quelqu'un dont l'orthographe est
presque parfaite sur un de leurs dadas, et ignorer complètement des
fautes courantes, grossières et assez peu discutables.
Personnellement, je m'estimerais déjà très satisfait de l'orthographe
de mes compatriotes s'ils arrivaient au point de distinguer
clairement je ferais et je ferai, s'ils
écrivaient regarde ! sans y mettre une ‘s’ et il
faut qu'on se voie avec un ‘e’ et pas un
‘t’. Lorsque ce niveau sera franchi, on pourra réfléchir
à la question de savoir si Clemenceau s'écrit avec un accent aigu,
merci pour lui mais il n'est pas vraiment prioritaire.
Je parle d'orthographe, mais je devrais sans doute parler plus
généralement d'usage de la langue (comme le propose ce
fameux livre de Maurice Grevisse auquel j'ai assez fait
référence). Les
maniaques sont généralement maniaques bien au-delà de
l'orthographe : il y a quantité de choses qui les font sursauter.
Parfois ce sont des choses très isolées : comme ceux qui insistent
pour vous faire savoir que autant pour moi doit selon eux
s'écrire au temps pour moi. Parfois c'est une croisade contre
un phénomène général, le plus courant étant celui des anglicismes (ce
que ne comprennent pas la plupart des gens qui partent dans cette
croisade-là, c'est que la majorité des « anglicismes » qu'ils relèvent
en français sont, en fait, des usages qui existent depuis très
longtemps et dont la fréquence a soudainement crû à la fin du
XXe siècle sous l'influence de l'anglais). Ceci étant, je
ne suis pas hostile au fait qu'on me signale des subtilités de
l'usage, j'aime beaucoup les subtilités (par exemple, mon poussinet me
reprochait de parler de wagon pour un des constituants d'une
rame de métro : selon lui, quand on transporte des passagers, on doit
parler de voiture ; consultation faite du TLF, celui-ci donne des exemples chez
Proust, Romains, Cendrars et d'autres d'usage du mot wagon pour
des éléments transportant des passagers ou même spécifiquement pour le
métro : mais je ne suis pas mécontent d'apprendre que certains usages
officiels font la distinction, et dans certains cas je pourrais
chercher à la faire). C'est juste qu'il faut se rappeler qu'on n'est
probablement pas en train de signaler une faute, mais de
profiter de l'occasion pour suggérer une nuance : il convient
donc d'avoir le tact qu'on aurait pour soutenir à un rabbin que tel
aliment n'est pas kasher — pas d'être
un nazi de la
grammaire.
Inversion du sujet à la première personne du singulier
Je suis toujours excessivement agacé quand les
grammaires donnent des informations incomplètes, et particulièrement
quand il s'agit de morphologie. Quand il s'agit de syntaxe,
évidemment, on ne peut pas imaginer couvrir tous les cas possibles
imaginables, mais dans la morphologie, a priori, on peut, ils
sont explicitement énumérables, et je suis d'avis qu'une grammaire
devrait donner des règles complètement algorithmiques, ou des tableaux
complets, permettant avec certitude de déterminer n'importe quelle
forme de la conjugaison ou de la déclinaison. Je me souviens, quand
j'essayais d'apprendre le grec par moi-même quand j'étais au collège
(et que apprendre le grec voulait dire, pour moi, me farcir la
totalité de tous les tableaux de conjugaison possibles imaginables
sans jamais me soucier de, disons, traduire un vrai texte d'un vrai
auteur grec), j'avais été excédé de constater que mes grammaires ne
donnaient pas de règle précise pour la formation du plus-que-parfait
de certains verbes (pour un verbe régulier typique, le parfait se
forme avec un redoublement de la première consonne, par
exemple λύω
→ λέλυκα,
et le plus-que-parfait prend un augment ἐ,
donc ἐλελύκειν ;
mais il y a plein de phénomènes modifiant ce redoublement, même quand
le parfait reste plus ou moins régulier, et en particulier le parfait
peut commencer par une voyelle,
genre ἀγείρω
→ ἀγήγερκα
ou γνωρίζω
→ ἐγνώρικα…
mais alors que faut-il faire pour le plus-que-parfait ? faut-il
omettre l'augment, le contracter avec la voyelle ou rallonger
celle-ci ? mes grammaires ne l'expliquaient pas, mon dictionnaire ne
donnait pas la forme du plus-que-parfait, et j'étais furieux de ce
manque de complétude). Bon, j'ai vite compris que la conjugaison
grecque, en fait, consistait surtout à ne pas chercher de règles (il y
a une apparence de règles dans la morphologie grecque, mais
quand on regarde dans le détail, parfois ε+ε se
contractent en ει et parfois en η, parfois un α
long devient un η et parfois non, et les grammaires glosent
vaguement sur les raisons de ces choses-là mais ne donnent pas des
règles suffisamment précises pour être prédictives) et à apprendre des
milliers de formes verbales par cœur…, et j'ai
abandonné : le latin est plus une langue de mathématiciens que le grec
classique, et il est surprenant que les Grecs anciens aient produit
plus de mathématiciens que les Romains.
Maintenant prenons le français : c'est aussi une langue à la
conjugaison assez redoutable, même s'il y a assurément moins de formes
au total qu'en grec ancien ou qu'en arabe. Il y a un petit livre
formidable qui les donne censément toutes, le Bescherelle
(et qui a un succès tel qu'il est devenu quasiment synonyme
de conjugaison ; il a tenté de capitaliser sur ce succès en
éditant également un Bescherelle de l'orthographe et
un Bescherelle de la grammaire, j'en ai des exemplaires
qui doivent être assez collector, mais ça n'a eu guère de succès, et
il faut dire qu'ils sont peu utiles ; le Bescherelle
s'est recentré sur la conjugaison — en revanche, ils ont fait
d'autres langues que le français, et j'ai par exemple ceux de
l'italien et de l'arabe — et la grammaire a été mise sous forme
d'un petit appendice sur l'emploi du verbe). A priori, si on a
le Bescherelle, on peut produire toutes les formes de
tous les verbes français sans avoir à réfléchir.
Mais je me suis rendu compte qu'il y avait une forme (au moins !)
que le Bescherelle avait oubliée dans ses tableaux : la
première personne du singulier à sujet inversé. En général,
l'inversion du sujet ne crée pas de forme de conjugaison nouvelle
(tu viens → viens-tu), tout au plus insère-t-elle
un ‘t’ de liaison (il va → va-t-il), ce
qui est moins déplaisant que les petits gags d'orthographe que
d'autres liaisons du même genre fournissent (va dehors
mais vas-y). Mais la première personne du singulier pose, au
présent de l'indicatif et du subjonctif et dans une certaine mesure à
l'imparfait du subjonctif, des difficultés particulières.
On n'écrit pas aime-je mais aimé-je,
ou aimè-je depuis une réforme de l'orthographe de 1990. Ce
‘é” ou ‘è’ (prononcé [ɛ] dans tous les
cas) a pour but de rendre prononçable la succession
consonne+“je” — du moins c'est ce qu'on prétend
parfois, mais c'est de la pure mauvaise foi puisque aime-je n'a
aucune raison d'être moins prononçable que aimes-tu
ou aime-t-il (visiblement aime-t-on la succession m+consonne
puisqu'on en rajoute une exprès !) et comme je vais le dire on invente
parfois ce [ɛ] à des endroits où il y n'y avait de toute façon
aucune consonne gênante. Très bien, mais quelle est la règle,
exactement ? Faut-il remplacer sans réfléchir tout ‘e’
final par un ‘é’ ou ‘è’ ? Non, par exemple on
inversera je pèse en pesé-je (ou pesè-je) et
certainement pas pèsé-je ; de même, je jette
devient jeté-je et pas jetté-je ; et il semble
que j'envoie devient envoyé-je (et là on se rend bien
compte de l'hypocrisie de cette histoire de rendre la forme
prononçable, puisque envoie-je aurait été aussi prononçable que
le mot voyage). Le principe du Bescherelle étant
qu'on puisse trouver toute forme sans avoir à réfléchir,
cette forme inversée aurait dû être donnée.
La règle, apparemment, est que pour les verbes du premier groupe,
on prend la deuxième personne du pluriel et qu'on remplace le
“-ez” final par “-é[-je]” ou
“-è[-je]”. Il doit être équivalent de prendre le
participe passé (du moins ne vois-je aucun exemple où ces règles se
contrediraient). Pour tous les autres verbes, on garde la forme
normale de la première personne du singulier, si ce n'est que pour
beaucoup de verbes l'inversion provoque une aversion telle qu'on
trouve une autre formulation : on dira
bien ai-je, suis-je, dois-je, fais-je, dis-je, vois-je
et
éventuellement veux-je, entends-je, sens-je, connais-je
et quelques autres ; pour pouvoir, il y a une forme spéciale
(que je puis également utiliser sans inversion), puis-je, et on
évitera peux-je ; il est vrai que des phrases comme vis-je
encore ?, ne dors-je pas ?, peut-être cours-je plus vite
que toi, ne résous-je ton problème ?, ainsi sors-je
dignement, etc., ne sont pas très heureuses. (D'un autre côté, je
suis d'avis de ne pas tolérer que la langue ait des verbes défectifs,
et que toute forme manquante doit être fabriquée et imposée de force.
Et à ce titre, je préfère encore faire violence à l'euphonie en
suggérant mets-je, veux-je, cous-je, écris-je,
plutôt qu'à la logique en
adoptant metté-je, voulé-je, cousé-je
et écrivé-je, comme Grevisse en relève quelques exemples quand
il discute du sujet dont je parle, cf. Le Bon Usage,
§794.)
Mais ceci n'est que pour l'indicatif. L'inversion se fait aussi au
subjonctif, avec une valeur optative, jussive ou conditionnelle : pour
le subjonctif
imparfait, eussé-je, fussé-je, dussé-je sont d'un
emploi assez courant (tous ces accents aigus pouvant être graves
depuis 1990), et par l'intermédiaire des deux premiers tout verbe au
subjonctif plus-que-parfait ; comme le subjonctif imparfait
est toujours régulier (à partir de la forme du passé simple),
on peut en déduire que l'inversion se fera toujours sur ce modèle.
Pour le subjonctif présent, puissé-je est aussi courant, mais
c'est un peu court pour en déduire une règle. Une chanson de Mylène
Farmer (admirez la référence) propose ainsi sois-je (mais elle
prononce [ɛ̃.si.swa.ʒə] et pas
[ɛ̃.si.swaʒ]. Mais pour les autres verbes ?
Faut-il comme au présent de l'indicatif et à l'imparfait du subjonctif
changer un “-e” muet en “-é[-je]” ou
“-è[-je]” ? Faut-il par exemple imaginer
écrire vienné-je assez vite à ton secours quand tu
m'appelleras ! ? Et pour le verbe voir (dont la forme non
inversée est que je voie), cela
deviendra-t-il voyé-je ?
Ah, naquissé-je seulement plus doué, que ne résolvé-je de mystères
de la langue française !
Apprendre à lire la Déclaration universelle des Droits de l'Homme
Les six langues officielles des Nations Unies sont l'arabe, le
chinois, l'anglais, le français, le russe et l'espagnol. Même si on
peut discuter dans le détail (par exemple pour arguër que le
hindi+ourdou devrait y figurer si on ne compte qu'en nombre de
locuteurs ; ou que le chinois ne devrait pas y figurer si on mesure
l'usage limité qu'il en est fait comme lingua franca en-dehors
d'un pays ; etc.), il n'en demeure pas moins que, globalement, c'est
une bonne approximation des
langues importantes
au niveau planétaire. Disons que si on devait choisir six langues à
connaître pour se débrouiller sur Terre, pour être citoyen du monde,
il s'agit d'un choix plus que raisonnable. Malheureusement, ce sont
aussi six langues globalement plutôt merdiques au niveau de la
difficulté à les apprendre (je n'ai pas énormément de points de
comparaison, mais l'allemand, par exemple, est probablement nettement
plus facile à apprendre qu'aucune des
six[#] — je parle pour
quelqu'un dont la langue maternelle serait extrêmement éloignée des
sept langues en question).
Voilà ce qui me donne l'idée suivante : j'aimerais apprendre un
texte unique dans ces six langues. Apprendre, c'est-à-dire apprendre
à lire et à prononcer (fût-ce avec un accent pourri), tout en
comprenant ce que je lis ou prononce ; voire apprendre par cœur,
selon la patience que j'ai à réaliser ce défi. Le texte, choisi pour
son universalité et pour le fait d'être naturellement disponible dans
les six langues des Nations Unies (mais éventuellement dans beaucoup
d'autres si je veux continuer le défi), s'impose de lui-même : la
Déclaration universelle des Droits de l'Homme. Comme il est assez
long et qu'il faut un début à tout, il s'agit au moins de commencer
par savoir lire :
يولد
جميع الناس
أحراراً
متساوين في
الكرامة
والحقوق،
وقد وهبوا
عقلاً
وضميراً
وعليهم أن
يعامل
بعضهم
بعضاً بروح
الإخاء.
人人生而自由,在尊严和权利上一律平等。他们赋有理性和良心,并应以兄弟关系的精神相对待。
All human beings are born free and equal in dignity
and rights. They are endowed with reason and conscience and should
act towards one another in a spirit of brotherhood.
Tous les êtres humains naissent libres et égaux en
dignité et en droits. Ils sont doués de raison et de conscience et
doivent agir les uns envers les autres dans un esprit de
fraternité.
Все люди
рождаются
свободными
и равными в
своем
достоинстве
и правах.
Они
наделены
разумом и
совестью и
должны
поступать
в
отношении
друг друга
в духе
братства.
Todos los seres humanos nacen libres e iguales en
dignidad y derechos y, dotados como están de razón y conciencia, deben
comportarse fraternalmente los unos con los otros.
Bon, ce n'est pas tout de savoir comment ça s'écrit, il faut aussi
savoir comment ça se prononce. Je n'ai pas de problème pour le
français ou l'anglais, et je peux certainement trouver assez
facilement comment l'espagnol se prononce. Pour les trois autres
langues, il me manque (au moins) un complétement très
important pour que la tâche devienne vaguement algorithmique : pour
l'arabe la vocalisation complète, pour le chinois mandarin la
transcription en pinyin (tons compris) ou en bopomofo, et pour le
russe la place de l'accent tonique. Voire, directement, une
transcription précise en alphabet phonétique. Cela est beaucoup plus
difficile à trouver.
S'agissant de l'article 1 (ci-dessus),
on trouve assez
facilement ce qui me manque :
Все́
лю́ди
рожда́ются
свобо́дными
и ра́вными
в своём
досто́инстве
и
права́х. Они́
наде́лены
ра́зумом и
со́вестью
и должны́
поступа́ть
в
отноше́нии
дру́г
дру́га в
ду́хе
бра́тства.
On trouve même des enregistrements de gens lisant ça dans chacune
des langues en question, ce qui permet de savoir exactement comment il
faut prononcer. Pour les articles suivants, ce sera plus dur !
Par ailleurs, conformément à ce que
j'avais déjà souligné, il est
amusant et intéressant de faire des rercherches dans Google images des
différents mots. Par exemple, s'agissant du mot qui
signifie dignité (dans égaux en dignité et en droits),
voici ce qu'on obtient quand on le
recherche : en
arabe, en
chinois, en
anglais, en
français, en
russe
et en
espagnol : les êtres humains sont peut-être égaux en dignité, mais
manifestement ils ne se la représentent vraiment pas de la même
façon ! (Et sur ces images, je préfère clairement la version
espagnole.)
[#] Esquisse
d'argument : l'allemand a une prononciation passablement régulière par
rapport à son écriture (en tout cas par rapport à l'anglais ou au
français) et l'écriture donne toute l'information pour lire le mot
(contrairement à l'arabe, au chinois et dans une certaine mesure au
russe), sa grammaire est d'une difficulté modérée dans l'absolu
(nettement plus que l'arabe ou le russe), sa morphologie est limitée
(contrairement au français, au russe et à l'espagnol), et son
vocabulaire est productif à partir d'un nombre de formes de base
nettement plus limitées que la plupart des autres langues. Je pense
donc que quelqu'un qui ne parlerait, disons, que le tamoul (pour qu'il
soit un peu neutre dans le jugement), et qui disposerait de méthodes
ou de professeurs d'un niveau égal, aurait plus de facilité à
apprendre l'allemand que l'arabe, le chinois, l'anglais, le français,
le russe ou l'espagnol.
Des livres entiers ont été dédiés à l'histoire de l'alphabet.
Beaucoup moins sont consacrés à celle, qui me semble pourtant tout
aussi fascinante, des signes de ponctuation et de tous les autres
signes d'écriture qui ne sont pas alphabétiques. Je trouve
bien celui-ci,
par exemple, mais d'une part il coûte quand même très cher et d'autre
part je crois deviner qu'il se limite à un usage strictement
typographique (excluant, par exemple, les communications purement
électroniques et l'histoire de la ponctuation en informatique), ce qui
est dommage.
L'histoire devrait commencer avec l'apparition de l'espace (je ne
cesse de m'étonner du temps qu'il a fallu pour que les gens
comprissent que c'était une bonne idée de ne pas
collertouslesmotsensemble si on veut aider à la relecture), et devrait
couvrir jusqu'à la standardisation
d'Unicode, en passant par la
façon dont les claviers des machines à écrire ont été choisis et la
manière
dont ASCII
a fait la synthèse des jeux de caractères préexistants.
Et c'est une histoire compliquée, parce que les langues
s'influencent les uns les autres, et les signes se confondent ou se
séparent de façon pas forcément évidente. Pour comprendre l'histoire
du point-virgule,
il ne s'agit pas simplement de trouver le premier exemple d'un
point-virgule dans un texte imprimé (ça doit être vers la fin du XVe
siècle en Italie), il faut comprendre aussi comment le point-virgule
et
le deux-points
se sont différenciés et spécialisés (quel a été le premier texte à
utiliser l'un et l'autre ? et le premier à les utiliser avec
essentiellement les sens modernes ? je remarque par exemple que
le manuel
de typographie d'Étienne Dolet (1540) ne connaît pas le
point-virgule). Il ne faut pas oublier les signes un peu rares :
comment sont apparus les
signes §
(section ou
paragraphe), ¶
(paragraphe ou
pied-de-mouche), @
(arrobase) ou
encore †
(obèle ou glaive) dans les documents imprimés, et avec quel(s) sens ?
On trouve des bouts d'information sur Wikipédia (cf. les liens que
j'ai donnés) ou ailleurs sur le web, mais c'est souvent très partiel,
approximatif ou confus (on mélange allègrement l'histoire de
l'apparition du caractère, ses différents usages, sa version
informatique…).
J'ai évoqué la naissance
d'ASCII
en 1963[#] et 1967 : c'est une
date fondamentale pour la typographie informatique car les caractères
qui ont reçu cet adoubement caractères ASCII
sont devenus omniprésents, et les autres ont été relégués à un rôle de
second plan (même s'ils ont pu apparaître dans des jeux de caractères
ultérieurs : Latin-1
ou Unicode).
C'était sans doute inspiré des jeux de caractères informatiques
antérieurs, eux-mêmes inspirés des machines à écrire, mais la
cohérence n'est pas toujours très évidente. Et ça a changé la face du
monde : je ne sais pas au juste pourquoi le signe @
(arrobase) s'est retrouvé dans ASCII et pas le
signe § (ce dernier ayant quand même l'air plus commun
dans des textes typographiés traditionnels, que ce soit en anglais ou
en français, alors que le @ servait traditionnellement
uniquement dans quelques notations commerciales), mais je pense qu'il
n'est pas besoin d'expliquer comment le @ a vu sa
popularité boostée par cette inclusion dans ASCII
qui a permis de l'utiliser ensuite dans les adresses de courrier
électronique. Alors pourquoi @ et &
sont-ils dans ASCII et pas §
et ¶ ? Je n'en sais
rien. Cette
page fournit des explications sur certains caractères, mais pas
sur ceux-là. C'est d'autant plus bizarre, d'ailleurs, que des
caractères complètement anecdotiques se sont retrouvés
dans ASCII, le plus bizarre étant sans doute
la barre
verticale |[#2].
Mais c'est aussi ASCII qui a rendu universel
le backslash \[#3],
un caractère presque inexistant auparavant (son histoire est
racontée ici par le
Monsieur qui l'a inventé).
Les accolades mériteraient certainement qu'on parle d'elles : si
leur apparition dans ASCII est due au même Monsieur
que le backslash (voici
ce qu'il en dit), on peut se demander comment elles étaient
apparues sur les claviers de certaines machines à écrire pour
commencer — après tout, à part quelques mathématiciens, qui
diable aurait eu besoin ou envie de taper des accolades ? En
maths on les utilise pour désigner des ensembles, mais j'imagine que
ce ne sont pas les mathématiciens qui ont inventé ces signes. Je
subodore que leur premier usage était comme des signes très larges
placés, par exemple, dans une marge, pour regrouper des lignes entre
elles (ou n'importe quelle sorte d'items alignés verticalement), et
j'imagine que l'accolade gauche est née avant l'accolade droite
(peut-être que ce sont effectivement les mathématiciens qui ont
inventé l'accolade droite, et/ou les accolades utilisées
comme parenthèses et de taille seulement d'une ligne). Mais alors
comment se sont-elles retrouvées sur le clavier d'une machine à écrire
(si on veut faire des grandes accolades pour regrouper plusieurs
lignes, avoir une touche qui fait une accolade d'une seule ligne de
haut ne sert pas à grand-chose…).
Parmi les caractères dont l'histoire est intéressante, il y a
aussi Celui Qu'On
Ne Sait Pas Nommer — je veux dire celui qui est à
l'emplacement 35=0x23 dans ASCII et qui ressemble à
un dièse : #. Les gens le prononcent
généralement dièse mais ce n'est pas un dièse (le
dièse, c'est ça : ♯ — et ce n'est pas un signe utilisé
dans la notation d'autre chose que la musique). Il est souvent
utilisé en anglais pour précéder un numéro (un peu comme on
écrirait nº en français), et il semble qu'historiquement il
vienne d'une notation désignant (aux États-Unis) une livre de poids.
Pour cette raison, il est d'ailleurs parfois
appelé pound sign, ce qui est une réussite
géniale du Club Contexte parce que du
coup on le confond complètement avec le symbole £ de la
livre (l'unité monétaire britannique), d'autant plus que
le # est sur les claviers qwerty US
exactement à l'endroit où est le £ sur les claviers
qwerty GB (ça c'est vraiment génial, comme façon
d'alimenter la confusion). Bref, le # ressemble à un
dièse mais n'en est pas un, et s'appelle symbole de la livre même s'il
n'en est pas un ! (D'où la
suggestion faite dans le
Jargon File d'appeler ce caractère shibboleth —
comme שבלת dans
Juges 12:5–6.)
On pourrait dévier vers l'histoire de toutes les notations
mathématiques, d'ailleurs, mais je remarque quand même que ça se
recouvre assez peu : les mathématiciens, qui sont très friands de
notations exotiques, utilisent assez peu certains des symboles fournis
par la typographie (je crois que je n'ai à peu près jamais vu les
caractères $, @, § ou ¶ utilisés dans des articles mathématiques,
alors qu'ils fournissent un système commode de variations sur le
prime).
((J'en profite pour conclure par une exhortation (et je m'adresse à
tous ceux qui écrivent des textes, qu'ils soient littéraires ou
techniques) : celle de ne pas hésiter à faire un usage libéral,
éventuellement même créatif, de la ponctuation. Créer de nouveaux
signes de ponctuation est difficile, surtout dans le cadre d'échanges
de fichiers informatiques (où on est contraint par ce que les
standards permettent), donc il est par exemple difficile d'utiliser la
virgule d'interrogation et la virgule d'exclamation (des signes que
dont je prétends qu'ils auraient une certaine utilité), ou même le
point d'ironie. Mais on peut au moins composer « horizontalement »,
si j'ose dire, la ponctuation : c'est-à-dire, par exemple, si on en
ressent l'utilité !, de faire suivre un point d'interrogation ou
d'exclamation par une virgule, un deux-points ou un point-virgule,
pour indiquer la nuance avec plus de précision : ce n'est pas autorisé
par les règles traditionnelles de la typographie française, n'est-ce
pas ?, et ce sont justement ces règles que j'invite à aller voir dans
les toilettes si je m'y trouve. Dans des textes que j'écris pour
moi-même, il m'arrive d'utiliser deux points-virgules de suite ou
d'autres combinaisons un peu exotiques :: mais ce n'est pas aussi
intuitivement compréhensible : donc je ne recommande pas forcément ;;
par contre, les doubles parenthèses ont une certaine utilité, et se
comprennent assez bien, pour marquer un aparté un peu long,
typiquement un paragraphe entier. ⁂ Et finalement il n'y a
aucune raison de ‹ne pas se servir de signes un peu rares ou un
peu détournés›, tant que le lecteur peut facilement deviner que
usage l'auteur en fait, ou {au moins !,} tant que ça ne gêne pas la
compréhension.))
[#] La version de 1963
comportait les caractères 32=0x20 à 93=0x5d comme maintenant, donc
avec uniquement des majuscules (les cases 96=0x60 à 123=0x7b étaient
inutilisées, les dernières contenaient des caractères de contrôle
supplémentaires), et à la place de l'accent circonflexe
(^) et du souligné (_), en 94=0x5e et
95=0x5f, étaient une flèche vers le haut (↑) et une
vers la gauche (←).
[#2] Barre verticale
qui, dans ASCII, est indifféremment trouée au
milieu ou pas. Alors que dans Latin-1 et donc dans Unicode il existe
deux caractères différents de barre verticale : celle (|)
qui n'est pas trouée (à l'emplacement ASCII, donc
on est maintenant censé considérer que la barre en question n'est pas
trouée), et celle (¦) qui l'est et qui très franchement
ne sert absolument et rigoureusement à rien (on se demande vraiment
comment elle s'est retrouvée là). C'est assez perturbant, parce que
les claviers montrent souvent la barre verticale trouée pour le
caractère ASCII : on se retrouve donc avec une
touche représentant une barre verticale trouée et qui affiche une
barre verticale non trouée.
[#3] Le backslash était
prévu pour suivre ou précéder le slash pour former les signes
logiques ∧ et ∨ (utilisés
en ALGOL)
comme /\ et \/ ; mais en fait, c'est le
langage C qui a donné au backslash sont sens le plus commun en
informatique actuellement, comme un échappement (il faut aussi
signaler son usage
dans MS-DOS
pour remplacer le slash d'Unix parce que le slash était déjà pris
comme séparateur d'options à l'imitation
de VMS
et CP/M).
L'usage d'ASCII par le C est d'ailleurs un peu
surprenant parce qu'il ne fait aucun usage des
caractères $, @ ou ` et il fait
un usage minimaliste du ~ (et très particulier
du #) : c'est sans doute pour ça que le sens de ces
derniers est beaucoup moins clairement établi que ceux qui servent en
C.
Je crois que vous ne voulez vraiment pas rencontrer cette langue en
vrai :
§339. La forme d'un verbe est déterminée par
son mode, son temps, son aspect et
sa voix.
Les modes verbaux à flexion interne (ou finitifs) sont :
l'indicatif, le subjonctif,
le métajonctif, l'orthojonctif,
l'optatif et l'impératif (sur leur emploi,
cf. §828–852). Les modes verbaux à flexion quasi-nominale
sont : l'indéfinitif, le définitif et
le participe (sur leur emploi, cf. §853–867) : les
deux premiers sont souvent, et parfois aussi par abus de langage le
troisième, regroupés sous le nom de modes infinitifs. Les
temps simples sont (à l'indicatif) : l'éternel,
le présent, le prétérit et le futur.
Les aspects verbaux sont (à l'indicatif prétérit) :
l'aoriste, l'inchoatif, l'imparfait
et le parfait. (Sur l'emploi des temps et aspects,
cf. §898–914.) Les voix verbales sont : l'actif,
l'objectif et le subjectif (sur le sens des
voix verbales, cf. §784–789).
Toutes les combinaisons ne sont cependant pas possibles : le mode
optatif n'a pas de prétérit, et le mode impératif n'a pas de futur ;
le mode indéfinitif entraîne nécessairement l'aspect aoriste ;
l'aspect inchoatif n'existe qu'aux temps présent et prétérit, et le
temps éternel qu'aux aspects aoriste et imparfait.
§340. Chacun des mode, temps et aspect du verbe est marqué
par un flexème particulier, qui sont normalement adjoints dans cet
ordre sauf pour le flexème *u0[3] du métajonctif qui
est adjoint en dernier (cf. §347–351). Les voix verbales sont
ensuite marquées dans les modes finitifs par un jeu de flexèmes
(§390–398) dépendant du sujet principal aux voix active et
subjective, et de l'objet principal à la voix objective.
Il existe en outre, à l'indicatif, des temps dits composés
(cf. §378–382), qui sont le plus-que-prétérit (aux aspects
imparfait et parfait), le futur antérieur, et le conditionnel (ou
futur postérieur), formés respectivement par l'adjonction de deux
flexèmes *ne[2] du prétérit, d'un flexème du prétérit puis d'un
flexème *s[3] du futur, ou inversement d'un flexème du futur
puis d'un flexème du prétérit.
§341. Les paradigmes grammaticaux sont généralement donnés
sur le verbe *tis[2]gar[3]
(faire, accomplir).
Ainsi on a à l'indicatif : éternel aoriste tiset gar (il
fait), présent aoriste tisgar i (il fait), prétérit
aoriste tisne gar (il fit), futur aoriste tisgars
(il fera), présent inchoatif tisgarəŋ
(il commence à faire), prétérit inchoatif tisneŋ
gar (il commençait à faire), éternel imparfait tisja
gar (il fait pour toujours), présent imparfait tisjasu
gar (il est en train de faire), prétérit
imparfait tisneja gar (il faisait), futur
imparfait tisjas gar (il sera en train de faire),
présent parfait ekkar tis (il a fait), prétérit
parfait ekne tis-gar (il avait fait), futur
parfait ekkars tis (il fera).
(Pour les modes infinitifs et participe, cf. §403–410.
§342. L'indicatif n'est pas marqué par un flexème
particulier : *tis[2]gar[3]
(faire, accomplir) → tisgar i (il
fait, présent aoriste). Les verbes dits éthiques (dont
le mode naturel est l'optatif) et prennent cependant
flexème *pa2[4] : ainsi, *deʒ[3]
(avoir pour but) → deʒpa i (il a pour
but, présent aoriste), nepa deʒ (il eut pour
but, prétérit aoriste).
Le défi, ensuite, ce serait de reconstituer, à partir de ça, les
règles d'ordonnement des flexèmes (celles qui constituent les
§35ss).
J'ai déjà dû à plusieurs reprises sur ce blog dire du bien de la
méthode Assimil : pas
spécialement que je pense qu'elle soit meilleure qu'une autre dans
l'absolu mais je trouve que, avec ses enregistrements de textes
parlés et avec le principe d'apprendre instinctivement en s'efforçant
de comprendre ce qu'on entend/lit, elle convient très bien à quelqu'un
qui, comme moi, a une mémoire
essentiellement auditive, un goût
pour retenir des fragments de phrases, une satisfaction à comprendre
« naturellement » ce que j'entends, et aucune envie de parcourir des
listes de vocabulaire hors contexte ; par contre, il faut souvent que
j'y ajoute une grammaire pour satisfaire ma curiosité de geek pour les
règles complètes avec des myriades de cas et de sous-cas.
L'ennui, c'est que je suis aussi immensément paresseux. La méthode
Assimil est probablement la moins mauvaise pour les gens paresseux,
aussi, parce qu'elle demande assez peu d'efforts actifs, juste du
temps à trouver, mais même comme ça la patience d'arriver au bout de
quoi que ce soit que je commence me manque systématiquement. Surtout
que l'apprentissage d'une langue n'a pas de fin. Au contraire, c'est
une tâche dans laquelle les retours sur investissement tombent
rapidement. Ce n'est pas surprenant, d'ailleurs : quelle que soit la
langue, la fréquence des mots suit quelque chose comme
une loi de
Zipf, donc avec cent cinquante mots de vocabulaires on déchiffre
peut-être la moitié d'un corpus, mais il en faudra peut-être deux
mille pour comprendre les trois quarts du corpus et huit mille pour
les neuf dixièmes — bref, plus on progresse, moins on progresse
vite. Enfin, ça n'explique pas que je n'arrive pas au bout des
méthodes Assimil qui, elles, contiennent un nombre fini (et connu à
l'avance) de leçons et, même si la difficulté en va croissant, c'est
normalement surmontable ; et quand on finit, si jamais on finit, on
doit arriver pour la plupart des langues à baragouiner quelque chose
d'assez potable tout de même.
Le dilettante comme moi fait contre mauvaise fortune bon
cœur : apprendre une langue est difficile ? Qu'à cela ne
tienne : dès que ça deviendra trop difficile, on changera de langue.
Je présente ça comme un choix de paresseux, mais ce n'est pas
forcément idiot. Ou du moins, il faut savoir dans quel but on apprend
une langue. Quand je vois les difficultés que j'ai à lire le moindre
texte allemand, je renonce à peu près, pour ma part, à l'idée de
maîtriser complètement autre chose que le français et l'anglais ; et
même mon anglais je me décourage de la façon dont il fout le camp
quand il s'agit de le parler ou de l'écrire (mais au moins je le lis
aussi bien que le français). Bref, si j'entreprends d'apprendre une
autre langue, ce n'est pas pour la parler, ni même vraiment pour la
lire, c'est pour m'en faire une idée, c'est pour regarder un petit peu
sa beauté propre, ou peut-être simplement pour assouplir mes neurones
sur sa grammaire et exercer mon oreille et ma langue à ses sons. Ou,
si c'est pour comprendre des textes dans cette langue, ce seraient des
textes accompagnés de leur traduction : il n'y a rien d'absurde à lire
une œuvre en traduction mais, quand on rencontre une phrase
mémorable, une phrase particulièrement forte ou qui nous touche
spécialement, d'aller faire l'effort d'en retrouver la version
originale pour la décortiquer, mot par mot, et savoir ce que l'auteur
a vraiment écrit dans ses propres termes — or, pour cela, une
connaissance assez faible de la langue suffit, puisqu'on a déjà la
traduction, il s'agit juste de reconstituer les structures
grammaticales. (À titre d'exemple, j'avais apprécié que
la RATP, à une époque, mettait dans les couloirs du métro
des poèmes dans toutes sortes de langues, avec leur traduction
française ; ça m'avait permis d'apprécier un poème en russe, chose que
normalement je ne pourrais pas faire.)
Depuis que j'ai commencé ce blog, j'ai essayé avec la méthode
Assimil d'apprendre un peu de japonais, puis d'arabe. Dans les deux
cas j'ai arrêté, mais je garde l'espoir ou l'intention de reprendre
(surtout l'arabe, dont la grammaire m'intéresse plus, et qui ne pose
pas le problème des kanji que je ne pourrai jamais retenir puisque je
n'ai essentiellement aucune mémoire visuelle) : ce n'est d'ailleurs
pas forcément une mauvaise chose d'apprendre quelque chose, de se
donner le temps de l'oublier, et de le réapprendre ensuite — je
sais que quand il s'agit de maths, ça me permet de bien mieux
comprendre la deuxième fois (ou souvent, la trente-douzième fois).
Là, je viens de commencer l'étude du suédois. En fait, c'est plus
une blague qu'autre chose, je n'ai pas vraiment l'intention de m'y
mettre sérieusement. Le truc, c'est qu'il m'est arrivé plusieurs fois
que des gens (dans la rue, dans le métro, ou pendant que je faisais
les courses) s'étonnassent de la blondeur de mes cheveux et de la
couleur de mes yeux, refusassent de croire que je pusse être français
(pourtant, les blonds aux yeux bleus, en France, ce n'est quand même
pas si rare ! je veux bien que mes cheveux soient très clairs, mais de
là à m'apostropher à ce sujet…) et insistassent pour que je
dusse avoir des origines scandinaves. (Si j'en
crois cette
carte-ci ainsi
que celle-là,
ils n'ont statistiquement pas complètement tort, même si ce serait
plutôt la Finlande qu'il faudrait soupçonner.) Alors si les gens
veulent absolument croire que je suis Suédois je devrais peut-être
entretenir leurs illusions. Peut-être devrais-je me faire faire un
tee-shirt sur lequel serait écrit (en jaune sur bleu évidemment) :
Innan en idiot frågar: Ja, jag är egentligen blond och
blåögd. Men nej, jag är inte från Sverige.
(Avant qu'un idiot ne demande : Oui, je suis vraiment blond aux
yeux bleus. Mais non, je ne viens pas de Suède.
Ou faudrait-il ajouter
une interjection ?)
Pourquoi le suédois plutôt que le danois ou le norvégien, voire
l'islandais ? Simplement parce qu'il fallait bien faire un choix, et
que le suédois est le plus parlé (et peut-être le plus plausible pour
un blond aux yeux bleus ?), et peut-être que sa prononciation est plus
intéressante que celle du danois. Mais bon, mon but serait plutôt
juste d'arriver à comprendre la phonologie du suédois, qui a l'air
assez intéressante, et surtout d'arriver à l'articuler avec autre
chose qu'un accent allemand à couper au couteau (ce que j'ai
spontanément tendance à faire). Si ma paresse ne me dépasse pas,
après quelques semaines, je reprendrai l'arabe en alternance (en
gageant que le suédois et l'arabe sont assez différents pour ne pas
risquer de les mélanger).
Sinon, j'ai découvert qu'Assimil avait lancé la méthode de grec
ancien. Je savais déjà qu'ils avaient fait le latin, avec des textes
aussi mémorables que nous partons en vacances en voiture (non,
je n'ai pas le manuel sous la main pour vous vérifier comment ils ont
traduit voiture) : mais c'est vrai qu'il y a, en latin, une
tradition assez respectable de créer des mots pour tous les concepts
modernes (ne serait-ce que parce que le pape doit bien avoir un moyen
d'écrire une encyclique condamnant la dépravation sur Internet,
n'est-ce pas ? ), et même Harry Potter est traduit en
latin. Mais le grec classique, c'est encore bien mieux. Hélas, ils
n'ont pas poussé la blague au même niveau, et on ne parle pas, dans
l'Assimil grec ancien, de partir en vacances en voiture. Mais il y a
quand même une geek-valeur ajoutée certaine, c'est que la
prononciation utilisée dans les enregistrements est la prononciation
restituée où même les accents (mélodiques) sont respectés : le φ
est prononcé [pʰ] et pas [f], le ζ est prononcé [zd] et pas
[dz], etc.
Parlant de prononciation des langues anciennes, en errant sur
YouTube, je suis tombé
sur cette lecture
des 19 premiers vers de Beowulf en anglo-saxon
(Hwæt, wē Gār-Dena in geārdagum, /
þēodcyninga þrym gefrūnon, / hū ðā æþelingas
ellen fremedon, etc.) : c'est assez amusant à écouter. Et typique
de ce que je veux dire quand j'explique que ça peut être intéressant
d'apprendre une langue juste assez pour pouvoir la comprendre quand on
met le texte en regard de sa traduction.
Ce que j'aime bien dans le fait de vivre dans une ville assez
cosmopolite, c'est qu'on entend des gens parler toutes sortes de
langues. Un jeu que j'aime, c'est alors d'essayer de deviner laquelle
exactement. Il y en a que je sais reconnaître immédiatement (le
français ou l'anglais,
évidemment[#], ou l'allemand,
l'italien, le russe) parce que je les baragouine plus ou moins, ou
parce qu'en j'en ai au moins quelques notions (le japonais, l'arabe,
peut-être le hongrois), ou parce que je connais des langues assez
proches pour en avoir une idée (le néerlandais, l'espagnol), ou encore
parce que sans rien connaître de la langue j'ai assez l'habitude de
l'entendre parler pour savoir l'identifier (le chinois mandarin).
Parfois je ne saurai pas être parfaitement précis mais je saurai au
moins donner un petit nombre de suspects : entre le danois, le suédois
et le norvégien, j'y arriverais peut-être en entendant des gens parler
de façon parfaitement distincte ou si j'ai repéré à l'avance ce qu'il
faut écouter — mais en général je ne saurai que dire que c'est
sans doute une de ces trois langues (comme mon blog est fréquenté par
des gens infiniment raffinés et cultivés, j'imagine que je vais
provoquer la consternation par cet aveu : mais oui, comme ça, au pied
levé, je suis incapable d'identifier du danois, du suédois et du
norvégien parlés — surtout pas les deux derniers). Généralement
je suis assez nul pour ce qui est des langues non-européennes,
cependant : il est fort possible que j'aie pris pour du chinois des
langues qui n'en étaient pas, je ne suis pas certain d'arriver à
reconnaître du hindi et du tamoul, et je ne sais absolument rien des
langues d'Afrique subsaharienne. Même pour les langues européennes,
d'ailleurs, il m'est arrivé de faire l'erreur embarrassante de prendre
du portugais pour du polonais.
Je suis étonné de ne trouver nulle part sur Internet de cours ou de
concours de reconnaissance de langues parlées : je trouverais ça très
intéressant, moi, qu'une vidéo m'explique — échantillons de
conversation à l'appui — par quels indices identifier quelque
chose comme 200 langues différentes ; et ce serait rigolo de faire des
jeux ensuite.
Heureusement, s'agissant des gens qu'on voit dans la vraie vie, on
a souvent des indications annexes. Par exemple, ils peuvent avoir un
tee-shirt écrit dans leur langue, ce qui donne énormément d'indices
(mais il faut se méfier : souvent, ce sont des touristes, et ils
peuvent visiter plein de pays, surtout s'ils viennent de loin). Le
type ethnique aide parfois : le jour où j'entendrai deux personnes
apparemment asiatiques parler en swahili, je serai bien bluffé et je
ne m'en rendrai même pas compte (et c'est dommage, parce que ça a de
la classe, pour deux Thaïlandais à Paris, de parler en
swahili).
Et parfois il y a des mystères complets. Lundi, mon poussinet et
moi avons entendu trois personnes qui parlaient une langue qui était
peut-être du persan, mais je n'ai pas complètement écarté la
possibilité que ça pût être du turc ou de l'hébreu (ou de l'arménien,
ou de l'albanais… enfin, je dis des choses à peu près
complètement au pif, là). Ce n'est même pas forcément facile de
trouver des exemples de textes enregistrés dans certaines langues,
encore moins facile de trouver des exemples de textes comparables dans
toutes sortes de langues différentes.
C'est dommage : beaucoup de gens n'ont pas l'air d'apprécier ce
fait qu'on peut trouver une langue belle même sans la connaître
— par la forme de ses caractères, par la sonorité de sa
prononciation, par quelques notions de grammaire qu'on en sait, ou par
quelques mots qu'on aura appris par cœur et qu'on aura passé
beaucoup de temps à bien analyser, et qui font que même si on ne peut
vivre assez vieux pour savoir toutes ces langues, on peut au moins
leur témoigner un peu de respect et saisir le parfum de leur
poésie.
[#] Enfin, non,
pas évidemment : on peut très bien ne pas identifier des
langues qu'on connaît, et d'ailleurs il m'est arrivé de me demander
quelle langue quelqu'un parlait et de me rendre compte après un moment
que c'était du français (et même pas parlé avec un accent bizarre,
juste qu'avec le bruit ambiant je m'étais persuadé que ça devait être
une langue étrangère). Je me rappelle aussi que quand j'étais à
Munich avec mes parents en 1990 nous attendions désespérément de
rencontrer des vrais Bavarois, les vrais Bavarois étant
définis comme des gens dont l'accent serait si fort que nous ne
comprendrions rien de ce qu'ils disent : un jour, à côté de nous dans
un restaurant nous avons entendu deux Messieurs dont nous nous sommes
dit enfin, voici nos vrais Bavarois — mais à écouter plus
attentivement, on a remarqué que le mot focking était souvent
répété : en fait, c'étaient des Écossais qui parlaient anglais.
Je me remets à ma tentative
d'apprendre un peu d'arabe,
interrompue par deux semaines de
concours (ce qui n'est pas peu vu que ça ne fait que deux mois que
j'ai commencé à étudier cette langue…). J'en suis à la leçon
36 sur les 77 que compte la méthode : cela ressemble à presque la
moitié, mais en fait cette impression est trompeuse parce que j'ai
l'impression que la difficulté des leçons croît très vite, du coup
j'ai vaguement le sentiment de me faire arnaquer. Plein de points de
grammaire sont renvoyés à une hypothétique explication ultérieure avec
des encouragements conciliants (ne vous en préoccupez pas pour
l'instant — soit, mais du coup c'est plus lourd à apprendre
si on ne connaît pas la règle). Et surtout, j'ai l'impression qu'une
difficulté majeure de la langue — celle des pluriels, qui ne
suivent aucune logique — est complètement glissée sous le tapis
avec la recommandation apprenez bien chaque mot avec son
pluriel : moui, moi je veux bien, mais encore faut-il que je
puisse le savoir, le pluriel en question, or le lexique en fin de
volume a l'air de ne pas les donner systématiquement, ni de renvoyer
chaque pluriel à son singulier, pas plus que le petit dictionnaire
(pas terriblement bien fait) que je me suis acheté. Par
exemple, je
ne sais toujours pas quel est le (masculin) pluriel d'un adjectif
aussi commun
que جَمِيلٌ
(qui signifie beau et qui est un des rares adjectifs que je
connaisse), donc c'est mal parti pour apprendre chaque mot avec son
pluriel.
Peut-être que je m'y prends mal, mais cette langue est quand même
terriblement décourageante.
Normalement, toutes les bonnes idées vaguement évidentes ont déjà
été trouvées et implémentées (c'est l'inconvénient de naître trop tard
dans un monde déjà vieux), mais pour une fois que j'aimerais bien
trouver le truc tout fait, ben je ne trouve pas.
Je voudrais un site qui soit organisé probablement sous forme de
Wiki et consacré à l'apprentissage des langues : les natifs d'une
langue donnée pourraient y enregistrer des petits textes dans leur
langue (soit de leur composition, soit tirés d'œuvres du domaine
public ou de licence compatible avec le wiki), y adjoindre des notes
explicatives sur la langue (subtilités grammaticales, points de
vocabulaire peu évidents, etc.), ajouter des traductions dans une ou
plusieurs langues cibles (typiquement l'anglais, peut-être parfois
l'interlingua par exemple si le texte lui-même est en anglais),
peut-être aussi des traductions mot-à-mot, proposer des lectures à
haute voix du texte (d'une voix claire et distincte sur les textes
pour débutants ou bien avec un parler courant pour les plus
expérimentés, éventuellement avec plusieurs accents), etc. Dans
certaines langues, on ajouterait des informations auxiliaires au
texte, disponibles sur demande (en japonais, par exemple, un bouton
permettrait de faire apparaître sur chaque kanji sa lecture en kana,
en russe on pourrait avoir l'accent tonique sur chaque mot, en arabe
la vocalisation complète, en anglais la transcription phonétique,
etc.). Optionnellement, chaque mot pourrait renvoyer vers
le wiktionnaire, etc. Et bien
sûr, tout serait organisé avec des niveaux de difficulté clairement
indiqués.
La plus grande difficulté « politique » serait de savoir si, ou
comment, on peut éviter que tout passe par l'anglais (notes
grammaticales et traductions en anglais, etc.). Mais même pour faire
quelque chose de complètement neutre, avoir des textes organisés par
difficulté avec informations auxiliaires complètes (accentuation,
phonétique, vocalisation : cf. ci-dessus) et des lectures
enregistrées, ce serait fabuleusement utile.
Pourquoi, pourquoi, ce truc n'existe-t-il pas déjà ? Je
ne suis pas le premier à y penser, tout de même ‽
J'avoue qu'il y a peut-être une difficulté technique dans
l'utilisation du wiki, notamment pour ce que j'ai appelé l'affichange
sur demande des informations auxiliaires (accentuation, phonétique,
vocalisation) : il faudrait utiliser de la magie JavaScript
apparemment pas évidente à unifier avec le principal moteur wiki sur
le marché (mediawiki). Pour
l'hébergement, Wikia est sans
doute un bon endroit à envisager.
J'en suis à la leçon quatorze de ma ma
tentative pour apprendre un peu d'arabe, et les paris sont encore
ouverts pour savoir jusqu'où je tiendrai. Pour l'instant, la langue
(ou peut-être devrais-je dire, la présentation qui m'en est faite) est
juste assez tordue pour attirer mon intérêt de geek sans être assez
difficile pour me faire abandonner. Disons que, par rapport au même
nombre de leçons en japonais, les questions de grammaire et
d'écriture[#] sont beaucoup plus
envahissantes : j'ai donc dû voir, pour l'instant, un vocabulaire de
trente mots environ, et les phrases (qui parlent toutes d'écrivains
qui écrivent un livre avec un stylo ou de filles qui sont sorties de
la maison et allées au nouveau marché) ne sont vraiment pas
passionnantes ; en plus, tous les verbes sont à l'accompli (= au
passé) et tous les mots sont au singulier. C'est amusant, mon père
avait lui aussi, dans le temps, essayé d'apprendre
l'arabe[#2] avec la méthode
Assimil : mais c'était l'ancienne édition (en deux volumes, dont tout
le texte arabe était écrit à la main), et l'approche
pédagogique était visiblement très différente, on vous plongeait tout
de suite dans un texte un peu compliqué (une annonce faite dans un
avion) déployant à peu près tout l'alphabet, alors que la nouvelle
édition commence par une leçon d'une seule phrase, longue de deux mots
et utilisant cinq lettres
différentes : كَتَبَ
الْكَاتِبُ
(l'écrivain a écrit).
Phonétique
La prononciation de l'arabe semble un tantinet plus dure, pour un
Français, que celle du japonais. L'argument naïf serait de dire que
c'est parce qu'il y a plus de phonèmes, mais c'est un peu trompeur :
je me suis livré à l'exercice stupide de compter le nombre de phonèmes
dans quelques langues (compte tout à fait incertain vu que la notion
de phonème est mal définie) : j'ai trouvé très approximativement :
Langue
Consonnes
Voyelles
Total phonèmes
Japonais
16
5 + 5 longues
26
Français
21
11 + 4 nasales
36
Arabe
29
3 + 5 lg./dipht.
37
Anglais US
24
12 + 3 dipht.
39
Allemand
22
15 + 3 dipht.
40
Anglais GB
24
11 + 8 dipht.
43
Hindi
30
14 + 10 nasales
54
Bref, si le japonais est bas, l'arabe n'est pas spécialement haut
non plus. L'anglais US est plus bas que
l'anglais GB notamment
parce que la prononciation du ‘r’ fait que beaucoup de
choses qui s'analysent en diphtongues
en en-GB deviennent voyelle+[ɹ] en
en-US : je ne suis pas sûr que ce soit
vraiment une différence profonde ; sinon je suis surpris de voir
l'allemand aussi haut, mais c'est vrai que quand on pense à la
différence de prononciation
entre bieten, bitten,
beten, Betten,
[wenn sie] bäten, boten,
Botten, etc., il y a quand même des choses. Le
hindi est très haut notamment à cause de la double distinction
sonore/sourde et aspirée/non-aspirée sur les consonnes. Bref, ce
dénombrement est dénué de sens (je ne sais même pas comment on
compterait pour une langue à tons). Mais ce serait quand même
intéressant pour un esprit pervers d'inventer une langue qui ait les
consonnes de l'arabe multipliées par les grades du hindi, plus les
voyelles de l'anglais, et les tons du chinois cantonais : comme ça,
tout se dirait en une seule syllabe et personne ne se comprendrait au
téléphone.
Pour revenir à l'arabe, ce qui est difficile pour un
francophone/anglophone/germanophone/…, c'est l'utilisation du
pharynx, qui sert à
prononcer les quatre ou
cinq consonnes
dites emphatiques (et qui sont, en fait, pharyngalisées),
la fricative
pharyngale sourde [ħ] (notée par la lettre
ḥaʾˌ : ح), et le
fameux ʿayn
(ع) qui est parfois décrit comme la variante sonore de cette
dernière, [ʕ], mais qui, si j'en crois le Manuel de
l'Association phonétique internationale (lequel a le bon goût
d'avoir un chapitre consacré à l'arabe), n'est en fait jamais prononcé
de la sorte mais plutôt comme un coup de glotte pharyngalisé
[ʔˤ] (et apparemment certaines prononciations de l'arabe
en font une
épilaryngale [ʢ]) [#3].
Alors, pour ma part, j'ai fait suffisamment de phonétique pour savoir
comment réaliser, disons, une fricative épilaryngale sonore, mais
malheureusement, prononcer une langue ce n'est pas juste prononcer une
par une des articulations pures, encore faut-il les
enchaîner[#4], et je ne sais pas
si ce que je fais pour l'arabe est très crédible.
Je suis aussi intrigué par l'habitude de noter l'arabe sans les
voyelles (ça ressemble à une décision qu'aurait pris quelqu'un qui
voulait s'assurer que personne n'aurait le droit de lire quoi que ce
soit sans avoir d'abord passé un temps fou à étudier la langue). Si
je comprends bien, ça a pour conséquence que, exactement au contraire
du français qui fait à l'écrit la distinction dans la
phrase tu est sorti[e] selon que la personne à qui on parle est
un homme (auquel cas on écrit tu es sorti) ou une femme (tu
es sortie), l'arabe fait cette distinction à l'oral
uniquement, écrivant خرجت
pour prononcer [xaraʒta] ou [xaraʒti] selon qu'on
s'adresse à un homme ou une femme. Il ne doit pas y avoir beaucoup de
cas, en français, où on fait des distinctions à l'oral et pas à
l'écrit.
Grammaire
En revanche, pour la syntaxe et la structure grammaticale, on
retrouve beaucoup de choses étonnamment communes avec les langues
indo-européennes (ce qui donne une certaine crédibilité à la thèse
d'une origine commune des familles indo-européenne et sémitique). Par
exemple, la notion de verbe, de nom et d'adjectif, avec un
apparentement des adjectifs aux noms : tout ceci n'a rien de
naturel[#5], d'ailleurs en
japonais les adjectifs sont (au moins pour ceux en -い)
nettement plus apparentés aux verbes qu'aux
noms[#6], et d'autres langues ne
marquent pas nettement (ou pas du tout ?) ces catégories
grammaticales. Ou encore le fait de faire varier le verbe avec
son sujet (ce qui n'est pas plus logique qu'avec
son objet), et de différentier les cas nominatif et direct
(= accusatif) plutôt que, par exemple,
absolutif
et ergatif. Encore plus frappante comme ressemblance entre les
langues indo-européennes et les langues sémitiques est l'existence des
trois nombres : singulier, duel et pluriel ; le duel a
apparemment mieux survécu en arabe que dans la famille indo-européenne
où il a essentiellement disparu des langues modernes (à part pour les
pédants comme moi qui seraient capables de dire au cours d'un exposé
de maths and now, combine this lemma with the
previous two lemmate: the three lemmata, together, allow us to finish
the proof), mais déjà la distinction singulier/pluriel n'a rien de
vraiment naturel et, de nouveau, elle n'existe pas en japonais. On
pourrait dire quelque chose de semblable du genre des mots.
Du coup, pour ce qui est du dépaysement sapirwhorfien, l'arabe
n'est pas aussi bon que je l'espérais.
Informatique
Par contre, pour ce qui est de faire le kéké avec Unicode, l'arabe
est parfait. C'est un excellent test des polices vectorielles
parce que les lettres changent de forme selon les lettres voisines (et
font même quelques ligatures, quoique nettement moins que dans les
langues brahmiques) et qu'en plus si on écrit les voyelles ça fait
plein de caractères combinants qui doivent être correctement placés.
Il y a plusieurs polices vectorielles libres qui s'en sortent plus ou
moins bien, mais la seule qui a l'air de tout faire parfaitement
est la
police Scheherazade — elle ne fera pas de calligraphie
sophistiquée mais elle ressemble comme deux gouttes d'eau —
peut-être pas par hasard — à la police qui a servi à écrire
l'Assimil dans lequel j'apprends (en plus ça m'a permis d'entendre
parler des
excellentes polices
qu'offre le SIL
— sur une Debianoïde faire apt-cache search ttf-sil
et faire son choix).
L'écriture de la droite vers la gauche est perturbante sur un
ordinateur : tout le monde est d'accord que la touche backspace
doit effacer le caractère précédant le curseur (donc à droite
si on écrit de droite à gauche) et delete le
caractère suivant, mais que doivent faire les touches flèche
gauche et flèche droite ? Parmi les logiciels que j'ai
essayés, yudit (un éditeur pour
texte Unicode pur, dont j'apprécie les méthodes d'entrée) a choisi,
comme tout ce qui est basé
sur GTK+, de faire que
la flèche gauche aille effectivement vers la gauche et la flèche
droite vers la droite — c'est plus simple à comprendre, mais ça
veut dire que si on mélange des langues de directionalité contraire on
va faire des sauts bizarres dans l'ordre logique du texte si on garde
la flèche droite appuyée — alors
qu'OpenOffice.org a choisi
que la flèche vers la droite aille toujours en avant dans le texte,
quitte à ce que le curseur fasse des bonds bizarres si on mélange des
langues de directionalité contraire. Je suis curieux de savoir quels
logiciels connus ont fait quels choix en la matière (et, d'ailleurs,
lequel est le moins pénible à programmer). Il est aussi perturbant de
voir le sens des parenthèses s'inverser (l'idée étant que les
caractères ‘(’ et ‘)’ sont toujours des
parenthèses ouvrante et fermante, mais dont
l'apparence visuelle sera inversée dans un contexte
droite-vers-gauche).
Notes
[#] La comparaison est
faussée, cependant, du fait que l'Assimil japonais relègue
l'apprentissage des kanji (= idéogrammes chinois) à un volume séparé
dont l'étude est largement indépendante — l'idée étant de
permettre à ceux qui le souhaitent d'apprendre le japonais uniquement
parlé. Ça n'a sans doute pas beaucoup de sens de dire que, pour le
débutant, le-japonais-avec-des-kana-au-dessus-de-chaque-kanji est
apparemment plus facile que l'arabe-avec-toutes-les-voyelles-écrites,
mézenfin, c'est l'impression que j'ai.
[#2] Ma mère n'a cesse
de se moquer de lui à ce sujet parce qu'un jour, il y a fort longtemps
en Algérie, mon père a essayé de commander en arabe deux thés à la
menthe sans sucre, le serveur a eu l'air estomaqué, a fait répéter,
et a finalement apporté… deux cafés sucrés.
[#3] Si ces termes vous
semblent chinois (ou arabes…), voyez notamment
la page sur l'alphabet
phonétique que j'avais commencée — et jamais finie —
il y a assez longtemps. Les pharyngales s'articulent en
rapprochant l'arrière de la langue de la cavité du pharynx, soit comme
point d'articulation primaire (pour une pharyngale proprement dite)
soit comme point d'articulation secondaire (pour une pharyngalisée) ;
ce n'est pas très difficile à réaliser si on s'efforce d'utiliser la
base de la langue pour obstruer partiellement le passage de
l'air sans s'approcher du palais (on doit pouvoir voir la
luette dans un miroir) : la position de la langue est à peu près celle
de la voyelle [ɑ] (du français pâte, correctement
prononcé, ou de l'anglais britannique laugh).
Les épilaryngales, elles, s'articulent en rapprochant
le pli
aryépiglottique de l'épiglotte : ça c'est plus difficile à
expliquer (déjà,
voyez cette
image
et ce
manuel pour l'emplacement des différentes parties du pharynx) ; il
faut essayer d'obstruer partiellement le passage de l'air sans
utiliser la langue et sans non plus donner un coup de glotte.
(Moi je trouve que ça ressemble un peu à un râle d'agonisant, alors
que les pharyngales font plutôt vomissement — désolé pour la
poésie.) Il paraît que
la langue
aghul, parlée au sud du Daghestan, a l'idée complètement saugrenue
de faire une distinction phonémique entre pharyngales et
épilaryngales : donc, rappelez-moi de ne jamais essayer
d'apprendre l'aghul. Enfin, les laryngales, c'est beaucoup plus
facile ; d'ailleurs, si vous savez prononcer l'allemand, il y a un
coup de glotte (c'est-à-dire une occlusive laryngale, [ʔ]) au
début de chaque mot commençant par une voyelle
(prononcez Deutschland ʔüber ʔalles
et vous vous en rendrez bien compte), et en anglais comme dans
beaucoup de langues il y a une fricative laryngale [h].
[#4] Pour dire le
chat
(أَلْقِطُّ),
[alqitˤtˤu] il faut enchaîner une occlusive uvulaire
sourde [q] et une occlusive dentale pharyngalisée et géminée
[tˤtˤ] : ce n'est pas parce que je sais ce qu'il faut
faire que j'y arrive (pour un francophone, c'est très
casse-gueule).
[#5] Du point de vue
sémantique, il est évident qu'il y aura des mots d'une langue qui
désigneront une action (qui prendront éventuellement des
compléments indiquant l'agent et le subissant de l'action) et d'autres
une chose concrète (qui prennent typiquement moins de
compléments), mais il n'y a pas de raison que cette distinction se
traduise par une différentiation de catégories grammaticales (pas plus
qu'on n'a besoin de catégories grammaticales distinctes pour
distinguer les mots désignant des choses concrètes et ceux
désignant des concepts abstraits). D'ailleurs, la
distinction verbe/nom ne recouvre même pas cette distinction
sémantique : si je dis brillante victoire des Romains sur les
Carthaginois, le contenu sémantique du mot victoire est le
même que ont vaincu dans les Romains ont brillamment vaincu
les Carthaginois (pareil, forte pluie sur la campagne par
rapport à il pleut fort sur la campagne), et le mode nominal ou
verbal a plutôt pour fonction de déterminer l'aspect de l'énoncé
(positif/déclaratif ou absolu/infinitif) que pour faire varier le sens
du noyau de l'énoncé en question. Tout ça pour dire que la
distinction verbe/nom n'a rien d'obligatoire (parmi mes nombreux
projets inachevés, il y
a celui de créer une
langue qui éviterait complètement cette distinction tout en ayant
une grammaire extrêmement régulière).
[#6] En japonais, pour
mettre au passé une phrase comme l'arbre est grand (quelque
chose
comme 木は高いです),
on met au passé l'adjectifgrand
(高い→高かった).
Pour un cours très geek-friendly (i.e., qui en souligne la logique) de
la grammaire japonaise, je
recommande le résumé de Tae
Kim.
Je suis un grand fan de la
méthode Assimil, pas forcément
que je la trouve excellente dans l'absolu, mais il me semble qu'elle
convient très bien à quelqu'un qui, comme moi, a une mémoire
essentiellement auditive[#] :
la meilleure façon d'apprendre une langue serait donc bien d'écouter
des phrases prononcées dans cette langue, en en comprenant le sens, en
cherchant juste à activer les connexions neuronales entre les deux,
jusqu'à ce que « ça rentre ». Et je pense qu'en allant au bout d'une
méthode Assimil avec beaucoup de régularité, on doit arriver à un
niveau pas complètement ridicule dans une langue donnée : c'est là que
ça pèche, bien sûr, parce que je n'arrive pas à garder une motivation
suffisante pour maintenir la régularité. Il faut y passer une bonne
demi-heure par jour (et encore, je pense que c'est une minoration,
parce que le temps de bien réécouter la leçon de la veille, écouter
trois ou quatre fois la leçon du jour, s'exercer un peu à l'écriture,
faire les exercices, préécouter la leçon du lendemain, trente minutes
sont déjà justes), et, mine de rien, ce n'est pas facile à
trouver.
En 2001, je n'étais arrivé qu'à la
douzième[#2] leçon de l'Assimil
hongrois — il est vrai que c'était
un crash-course puisque je partais une semaine à
Budapest et que je voulais au moins pouvoir prononcer correctement
Nem beszélek
magyarul![#3][#4]
avant de partir, ce qui est tout de même un niveau qu'on dépasse à la
12e leçon. Il y a deux ans j'avais poussé un peu plus loin pour le
japonais, en allant jusqu'à la 29e leçon (j'avais fait un an d'étude
du japonais en grand débutant à l'ENS mais je n'avais
strictement rien retenu). À la limite, qu'il ne m'en reste
consciemment rien n'a aucune importance : mon but n'était pas vraiment
d'apprendre du hongrois, respectivement du japonais, mais de me faire
une représentation mentale de ces langues, d'assimiler un peu de leur
structure
(voire
d'assouplir mes propres mécanismes de pensée). Bref, de transformer
quelque chose de complètement opaque en quelque chose de
certes toujours opaque mais où je peux imaginer de progresser.
Là je me suis acheté l'Assimil
arabe[#5]. Pourquoi l'arabe ?
Peut-être parce que je m'efforce à trouver des langues aussi éloignées
que possible les unes des autres (auquel cas il faudrait sans doute
que je programme ensuite le tamoul, le chinois et le swahili), de
façon à avoir une petite image de la forteresse de Babel. Peut-être
parce que c'est une langue
importante parlée
en France (mais l'argument est un peu pipo : l'arabe parlé en
France est dialectal, et a priori ce n'est pas spécialement celui-là
que je vais/veux apprendre). Ou peut-être parce que l'écriture en est
absolument fascinante. Toujours est-il que je ne pense pas
sérieusement arriver à un stade où je pourrais lire quoi que ce soit
d'intéressant[#6], encore moins
comprendre la langue parlée, mais l'idée est juste de picorer quelques
notions sur comment l'arabe fonctionne, et de voir si ma patience va
cette fois au-delà de la 29e leçon (en ce moment j'en suis à la 3e, où
on voit des phrases aussi passionnantes
que دَخَلَ
الْوَلَدُ
وَ دَرَسَ
— l'enfant est entré et il a étudié).
[#] Et dont
l'apprentissage des langues reste quelque chose de complètement
théorique vu que je n'ai aucune intention de voyager pour essayer
de m'en servir. C'est vrai que je suis un cas un peu spécial.
[#2] Pour comparaison,
le nombre total de leçons d'une méthode Assimil a l'air de tourner
entre 75 et 100 en général (mais en fait on est censé faire deux
vagues d'apprentissage, ce qui veut dire qu'ils estiment qu'il faudra
environ cinq ou six mois pour atteindre le niveau qu'ils
proposent).
[#3] Je ne parle pas
hongrois !
[#4] Mon directeur de
thèse (qui partait au même congrès à Budapest) s'est mis au hongrois
au même moment, et avec la même méthode, mais il a eu plus de
persévérance que moi et il semble que maintenant il ne baragouine pas
trop mal la langue.
[#5] Chose amusante,
ils ont retiré du titre leur célèbre marque de fabrique : sans
peine (même si la collection s'appelle encore ainsi). Est-ce
qu'ils n'osent plus dire que c'est le cas ? Ou est-ce qu'ils sont
tombés victimes de la fameuse blague : — Il paraît que vous
avez appris à jouer du violon en cinq leçons
faciles. — Oui, c'était les neuf mille neuf cent
quatre-vingt-quinze suivantes qui étaient difficiles.
[#6] Surtout que
l'arabe a (comme l'hébreu ou d'autres langues de la même famille) ce
défaut pour les débutants que — à part pour écrire le Coran ou
des textes poétiques — on n'y note normalement pas les voyelles
brèves. Donc à moins de connaître la langue, celui qui aurait juste
appris l'alphabet ne peut même pas prononcer un texte écrit.
D'ailleurs, l'égyptien ancien — j'en
ai fait un peu — est dans le
même cas, sauf que, là, personne ne sait quelles sont les bonnes
voyelles sauf dans un petit nombre de mots, donc on prononce tout
‘e’.
I hate English syntax because it's so persistently ambiguous.
Just minutes ago I was playing with the newly unveiled (and quite
wonderful) Google Trends
and I searched for
Google itself. One of the news headlines that appeared in
the list was:
Google shares sink
So I wondered, hmmm, what might be this kitchen
sink that Google is sharing? Of course, a minute later, I
realized that shares is not the verb but the subject and
sink is not the object but the verb. Ah. This f*cking habit
the English language has of simply juxtaposing words without
indicating grammatical relationship (e.g., writing Google
shares instead of Google's shares)—and it's
particularly bad in newsspeak. I remember sometime back in 2000 I had
come across a headline that read
U.S. appeals court asked to rule on Florida recount
—and I figured there were dozens of ways it could be
parsed:
A U.S. court of appeal has been asked to rule
concerning the recount in Florida. The U.S.
government appeals the court which had been asked to rule concerning
the recount in Florida. The American appeals, which the court has
asked to rule over Florida, are recounting. The American appeals,
which the court has asked, are about to rule concerning the recount in
Florida.
—and so on: any of the words appeals, asked,
to rule and recount (and possibly even court)
could be the main verb, and most of these possibilities give rise to
at least two different parsings. I agree that most of them are
meaningless, but still: it takes some effort to produce such an
ambiguous sentence in French[#],
whereas in English it sometimes seems that every zeusdamn sentence has
a tendency to be parseable in many ways (even two-word ones like
abuse pains!).
I can see why it would be most unwise for an international treaty
to have English as only authoritative language! (There is the famous
case of the 1967
UN resolution 242 which calls for withdrawal of
Israel armed forces from territories occupied in the recent
conflict, meaning, of course, from the
territories, a reading clearly supported by the French version, retrait des forces armées israéliennes des territoires
occupés lors du récent conflit, but which some have wished to read
as from some territories. Not really the same sort of
ambiguity as mentioned above, but I'm sure better examples could be
found.)
On the other hand, garden-path
sentences make for terrific jokes. I found this one quite
hilarious when I first heard it:
Time flies like an arrow. Fruit flies like a banana.
The best I have, in
French, is la petite brise la glace, which can
mean the small girl is breaking the window or the slight
breeze is chilling her (similarly there is la
bonne sauce la coupe, la grande alarme le
modèle or le pilote ferme la porte, but none
is very convincing). There is also the strange case of c'est après que c'est arrivé, which can mean two
completely opposite things: it happened later or it
was after it happened—but it's not really the same kind of
ambiguity.
J'ai une mémoire essentiellement auditive, au moins par opposition
à visuelle (je ne parle pas de mémoire conceptuelle ou procédurale).
Sans avoir fait des statistiques sérieuses, j'ai l'impression que
c'est relativement rare : la plupart des gens me disent, quand ils
retiennent un texte par cœur, qu'ils « voient » mentalement le
texte écrit, alors que moi, indiscutablement, je l'« entends ».
D'autres signes sont également clairs : si on me montre brièvement un
arrangement de sept signes géométriques simples (dans le genre carré /
rond / triangle / croix), je ne suis pas capable de les reproduire,
alors que si on prononce sept syllabes dénuées de sens, je peux sans
difficulté les répéter. (Je me tiens à sept, parce que c'est
généralement admis comme le nombre le plus commun de cases de stockage
pour ce genre de mémoire à court terme, et d'ailleurs peut-être lié à
des raisons dans la structure du cortex.) Autre exemple : je connais
une cinquantaine de décimales du nombre π (normalement je n'ai pas
trop « la mémoire des chiffres », là je les ai apprises quand j'étais
petit et jamais oubliées depuis), mais je les retiens comme une
contine : trois virgule un quatre un cinq neuf deux six cinq trois
cinq, etc., et je serais incapable de prononcer les chiffres groupés
diffémment (comme : trois virgule quatorze quinze quatre-vingt-douze
soixante-cinq trente-cinq, etc.) ou dans une autre langue (comme :
three point one four one five nine two six five
three five), alors que quelqu'un qui « verrait » les chiffres
défiler pourrait plus facilement les lire dans une autre langue.
Accessoirement, il m'est deux fois plus difficile de retenir un zéro
qu'un autre chiffre, pour la raison totalement idiote qu'en français
le mot « zéro » a deux syllabes !
La chose est assez frappante comme en ce moment (depuis
trois-quatre semaines) j'essaie d'apprendre le japonais avec la
méthode Assimil (dont le
principe, qui me semble globalement très bon, est : commencez par
écouter, répéter, lire et comprendre, ne cherchez pas spécialement à
apprendre le vocabulaire, essayez juste de vous familiariser avec le
texte jusqu'à ce qu'il vous semble naturel, puis passez à la leçon
suivante) : la compréhension à l'écoute me vient vite, je retiens
énormément de bouts de phrase ou de phrases entières[#], alors que l'écriture me reste
décidément opaque (je me suis forcé à apprendre à lire au moins tous
les kanas — ce qui ne veut pas dire que je ne mets pas un temps
considérable à en reconnaître certains — mais je ne sais même
pas les retracer, et pas non plus les kanjis sauf un ou deux). Il
faut dire que, là, la méthode incite à la paresse parce qu'elle
transcrit systématiquement tout en rōmaji (Hepburn) : du coup,
je retape les textes sur mon ordinateur pour pouvoir le relire ensuite
en écriture japonaise (mais avec ruby[#2]).
Une conséquence de ma mémoire auditive, c'est que je connais pas
mal de textes par cœur. Je veux dire : je ne suis pas du tout
du genre à retenir des tables de capitales des pays du monde (quelle
est la capitale du Bhoutan ? Timphou — etc.). En
revanche, des pages célèbres, des discours, des poèmes, des chansons,
oui, tout à fait. Enfin, au total, pas énormément (sans doute moins
qu'un acteur qui apprendrait par cœur les répliques d'une seule
pièce), mais des textes extrêmement éclectiques. Souvent je
n'ai même pas fait d'effort particulier pour apprendre (un jour par
exemple je me suis rendu compte que je connaissais les quatre premiers
paragraphes de la déclaration
d'indépendance des États-Unis alors que je n'avais pas
spécialement voulu, je m'étais contenté de la lire attentivement et
d'en apprécier la construction). Et j'ai aussi tendance à ne pas
oublier ce que j'ai appris : c'est ainsi que je connais encore par
cœur un long passage de
Pouchkine en russe que javais dû apprendre en terminale, alors
qu'il y a beaucoup de mots dont j'ai oublié le sens (parce que le
russe, lui, je l'ai beaucoup oublié). Globalement, les choses que
j'apprends sont tout de même surtout des répliques théâtrales qui me
semblent particulièrement fortes ou célèbres (comme le fameux
monologue de la
scène 1 de l'acte III de Hamlet ou les
scènes 4 et 5 de l'acte I du Cid), des poèmes que j'aime lire et réciter, et, parmi les
chansons, des hymnes (on a déjà eu un
exemple ici, et, de peur qu'on me prenne pour un dangereux
gauchiste parce que je connais les six strophes de
l'Internationale (mais en français, pas en russe), je
sais aussi les hymnes nationaux anglais, allemand, américain ou
canadien) et des paroles de génériques
idiots et quelques tubes en tous genres — parce que c'est
conçu pour rester facilement en mémoire. D'ailleurs, c'est pareil
pour les vers : je crois que j'ai une affinité particulière pour la
structure de l'alexandrin, et décidément les sonnets de Heredia passent mieux que de
la prose ; je suppose que quelqu'un qui a une mémoire surtout visuelle
n'y trouverait pas trop de différence.
Tout ceci est tragiquement inutile, évidemment. Certes, une fois
j'ai pu faire impression en maudissant quelqu'un à la manière
d'Agrippine (dans Britannicus) : Tes remords te
suivront comme autant de furies, etc. Mais généralement on
s'aperçoit assez vite que mon répertoire est, finalement, assez
pauvre, et que quand je cite
Faust, ce sont essentiellement toujours les mêmes
vers.
(Et, non, avant que quelqu'un me pose la question, je ne fais pas
de théâtre, et je n'ai pas l'intention d'en faire. Même si plein de
gens me disent que je devrais.)
[#] En fait, j'avais
fait un an de japonais quand j'étais élève à l'ENS :
c'est-à-dire que j'avais juste assisté aux cours sans rien chercher à
retenir, et évidemment, du coup, il ne m'en est rien resté, à part
quelques hiraganas et une unique
phrase, この 着物 は
青く ありません —
mais je précise que je sais seulement la prononcer, pas l'écrire,
justement. Cela signifie : ce kimono n'est pas bleu. Un peu
difficile à placer dans la conversation, surtout quand c'est
la seule phrase qu'on connaisse.
[#2] Et j'en profite
pour déplorer le fait que Mozilla/Firefox ne gère pas
du tout le ruby ; et le
pire, c'est que s'il y a moyen de contourner cette limitation en
faisant du CSS un peu sioux (à base de display:
inline-table et autres horreurs), une obscurité dans un point
de la norme CSS (sur l'existence d'une ligne de base de
certaines boîtes) et un changement d'interprétation dans certaines
versions du Lézard font que je n'ai absolument pas réussi à produire
un document qui s'affiche correctement partout (l'alignement vertical
est aléatoire).
Suite :cette
entrée ultérieure est une sorte de suite, de complément ou de
redite de à celle-ci (je l'ai écrite alors que j'avais plus ou moins
oublié celle-ci).
Aujourd'hui, j'ai débuté un cours d'égyptien hiéroglyphique. (Il
est vrai que c'est désespérément banal d'apprendre l'égyptien
hiéroglyphique : le sumérien, ou le maya, au moins, ce serait un peu
original, pour rester dans la catégorie des langues mortes à
l'écriture pénible, et dont la grammaire est au moins aussi
intéressante et riche, mais bon, je m'efforce d'apprendre des choses
simples et utiles.) Le prof est intéressant (même s'il a un peu
tendance à digresser). Aujourd'hui il nous a surtout résumé
l'histoire de l'Égypte ancienne et de son langage et donné quelques
rudiments sur l'écriture (surtout les signes phonétiques unilitères),
et nous avons appris à écrire, par exemple, Anubis (enfin,
Jnpw ou quelque chose de ce goût-là) en hiéroglyphes. L'ennui,
c'est que comme c'est bien de l'écriture hiéroglyphique et pas
hiératique qu'il s'agit, prendre des notes est un peu difficile ; il
nous dit qu'il faut que nous nous formions une véritable
écriture et que nous ne fassions pas des dessins, mais j'ai
du mal à écrire, par exemple, un percnoptère
(le hiéroglyphe représentant un son dont la valeur n'est d'ailleurs
pas claire). Faire des tables grammaticales risque d'être un petit
peu pénible.
Vivement que les hiéroglyphes (au moins les plus simples) soient
dans Unicode ! Ce qui,
malheureusement, n'est pas trop près d'arriver, malgré la proposition
(à mes yeux ignares tout à fait bien convaincante) faite par le
phénoménal Michael Everson.
Comme une des choses qui font que la question n'avance pas est le
manque d'égyptologues pour évaluer les problèmes (et notamment juger
la proposition en question), je vais sans doute aborder le prof qui
nous fait le cours pour lui demander s'il connaît des gens qui
seraient prêts à se mettre en contact avec le consortium Unicode.
Un de mes amis (que je ne dénoncerai pas — appelons-le
mystérieusement R… — mais que tous ceux qui le
connaissent auront reconnu), qui est au moins autant que moi passionné
par Unicode et par les langages bizarres ou confidentiels, s'est
pointé avant-hier soir (lors de la petite soirée où nous célébrions le
nouvel an) avec une grammaire du slavon liturgique. Le
slavon est la langue d'où le russe moderne dérive ; il a été fixé par
écrit (ainsi que les alphabets cyrillique et glagolitique à cet effet
— on ne sait pas quel est le rapport précis entre eux) dans la
traduction de la bible des fameux moines (frères) Cyrille et Méthode
qui ont évangélisé la Russie à la fin du IXe siècle. Du « vieux »
slavon est dérivé à la fois le slavon liturgique de l'église orthodoxe
et le russe moderne ainsi que, essentiellement, les autres langues
slaves.
Le russe moderne est déjà une langue fort difficile (pour les
non-Russes) à cause de la complexité de son système morphologique (par
exemple, des huit cas de l'indo-européen primitif, six sont en usage
vivant : nominatif, accusatif, génitif, datif, instrumental et locatif
— seuls l'ablatif et le vocatif ont été perdus). Le slavon, il
est à craindre, est encore plus compliqué (mais pas démesurément non
plus : à titre d'exemple, il n'y a qu'un cas de plus qu'en russe
moderne, le vocatif, qui n'est pas terriblement dur à former ; la
conjugaison des verbes, cependant, est plus délicate car il existe de
vrais temps du passé alors que le russe moderne n'a gardé qu'une sorte
de participe utilisé comme passé ; et l'existence en slavon d'un duel
à côté du singulier et du pluriel complique aussi la morphologie).
Cependant, il n'est pas complètement incompréhensible par quelqu'un
qui connaît le russe (à titre d'exemple, de même qu'avec mes vagues
rudiments d'italien et ce que je sais de latin j'arrive à déchiffrer
quelques mots de Dante, de même, en ayant fait un peu de russe et en
ayant des notions de grec ancien — notamment de quoi lire
l'original du nouveau testament — je repère bien des formes
claires dans le texte slavon de la bible). Et on peut espérer qu'en
retrouvant l'origine étymologique de certaines bizarreries du russe le
langage apparaîtra comme plus clair et pas moins. Quoi qu'il en soit,
si j'ai le temps, je regarderai d'un peu plus près à quoi tout cela
ressemble. Il existe un cours
de vieux slavon en ligne.
Une chose qui frappe en premier abord, en tout cas, est la
multiplicité des signes. L'alphabet cyrillique moderne a trente-trois
lettres (si on distingue le ‘Ё’ du
‘Е’, comme je tiens à le faire, même si quasiment
tous les textes russes imprimés ou manuscrits de nos jours omettent
les deux points sur la lettre quand elle est prononcée
‘o’[#]) ; avant la réforme
d'orthographe de 1917, il en avait quelques-unes de plus,
notamment ‘І’ (remplacé partout par
‘И’ — causant notamment la fusion[#2] des mots міръ, le monde, et миръ, la paix, ceci
dit ces mots sont de toute façon de même origine) et
‘Ѣ’ (remplacé partout par ‘Е’
— causant notamment la fusion des mots ѣсть, manger, et есть, il y a), et il
y avait nettement plus de ‘Ъ’ (signes durs)
que maintenant. Cet alphabet russe provenait lui-même d'une réforme
(ou, en fait, plusieurs réformes successives) effectuée(s) par Pierre
le Grand pour transformer l'alphabet du slavon liturgique en un
véritable alphabet à usage civil. Car le slavon a un nombre assez
considérable de lettres : R et moi n'avons pas réussi à en savoir le
nombre précis car les grammaires se contredisent assez quant à la
question de savoir ce qui est ou n'est pas la même lettre, et
d'ailleurs la langue elle-même est parfois un peu floue (même si
l'orthographe en slavon liturgique est rigoureusement fixée, il n'est
pas toujours clair ce qui est une lettre différente et ce qui est une
simple variante de position, et il n'est pas non plus clair ce qui est
une ligature entre deux lettres et ce qui est une lettre à part
entière), et il y a eu des changements au passage entre le vieux
slavon (écrit en glagolitique ou dans la forme la plus ancienne de
l'alphabet cyrillique) et le slavon liturgique figé (disons, vers le
XVIIe siècle). Toute cette histoire est racontée de façon très claire
(au moins autant que possible vue la complexité de l'affaire) et très
intéressante dans ce
texte sur l'encodage de l'ancien alphabet cyrillique en TeX et en
Unicode. Les relations entre les lettres (surtout les voyelles)
sont très compliquées. Par exemple, le ‘Я’
du russe moderne dérive, à l'époque de Pierre, à la fois du
petit yus (‘Ѧ’, qui lui a à peu près donné sa
forme) et du a yodifié (environ ‘ІА’)
ligaturé (malheureusement
non codé séparément dans Unicode) — et même du petit yus
yodifié (‘Ѩ’) ligaturé — ces signes étant
distincts mais très fortement liés dans l'écriture du slavon. De
même, le nombre de lettres du slavon prononcées approximativement
‘(i)é’, entre le ‘Є’ (à ne pas confondre
avec le ‘Э’ récent, qui est une invention de
l'époque de Pierre), le ‘Е’ (en slavon liturgique
— peut-être une simple variante d'écriture de la lettre
précédente, mais peut-être pas), le ‘Ѥ’ (version
yodifiée-ligaturée de ‘Є’), le ‘Ѣ’
(qui a survécu jusqu'en 1917) et même le ‘Ь’ (qui
est maintenant un signe mou, mais qui à l'époque du vieux
slavon était une véritable voyelle), cela fait beaucoup. J'aimerais
bien arriver à me faire une idée un peu plus précise de toutes ces
évolutions (notamment concernant les yus petit et grand, les
yer dur et doux, et le yat, qui sont vraiment les
signes distinctifs du cyrillique).
Je me demande si, dans le catalogue des objets inutiles et bizarres
que je possède, je ne vais pas rajouter une édition de la bible en
slavon. En attendant, pour ceux qui veulent voir à quoi ça ressemble,
voici un
échantillon (la première ligne, par exemple, accents omis, donne :
И вѣ всѧ
зємлѧ
ѹстнѣ
єдинѣ, и
гласъ
єдинъ
всѣмъ.).
[#] Cela donne des
choses assez cocasses. Par exemple, le dirigeant de
l'URSS de 1953 à 1964,
(Никита
Сергеевич)
Хрущёв, est appelé
Khrouchtchev en français (Khrushchev en anglais) et la
manière dont on lit ce nom n'a à peu près aucun rapport avec la
prononciation russe d'origine, à commencer par le fait que la voyelle
finale, transcrite en ‘e’, est un ‘o’ (et il
porte l'accent tonique alors que les Anglais le mettent sur la
première syllabe).
[#2] Autre chose
cocasse : il paraît que le titre d'un célèbre roman de Tolstoï s'écrit
Война и
Міръ, c'est-à-dire La Guerre et le
Monde et pas Guerre et Paix comme ce serait si ça
s'écrivait avec un ‘И’, même si, évidemment, le jeu
de mot est volontaire. Rectification (2005-05-20) :
c'est probablement faux.
Je vais encore passer pour un pédant, un maniaque et un grincheux,
mais j'aimerais comprendre pourquoi je vois si souvent « in nomine
Satanis » ou encore « in nomine Satanas » (2000 et 1200 réponses sur
Google, respectivement) alors que la forme latine correcte est « in
nomine Satanæ » (12 réponses sur Google, que le ‘æ’ soit
ligaturé ou non) : le génitif de « Satanas » (décliné comme un mot
grec importé) est « Satanæ », comme attesté par la Vulgate
(Apocalypse 2:13, Scio ubi habitas, ubi sedes est
Satanae: et tenes nomen meum, et non negasti fidem meam et in diebus
Antipas testis meus fidelis, qui occisus est apud vos ubi Satanas
habitat). Ou alors « Satan » en faisant de ce mot un
indéclinable.
D'accord, ça n'a absolument aucune espèce d'importance (je
soupçonne que Satan réagit exactement autant quand on salue « in
nomine Satanæ » que « in nomine Satanis » ou « in nomine Satanas »),
mais c'est quand même lamentable de ne pas arriver à sortir trois mots
de latin sans se planter quelque part.
Oui, je suppose que je suis un vieux grincheux. Ça doit être la
chaleur.
Forsan vos demanda vos, in qual lingua iste texto es scribite ?
Illo resimila como le italiano o le espaniol, mesmo le latino o le
francese, ma non es alicuno de iste linguas : es un lingua inventate,
etiam non le esperanto (plus confidential que isto !) ma l'interlingua, un specie de
pot-pourri de omne linguas latin (o
europee ?).
Pro alicunos, illo (io vole dicer, ille lingua) es un vaste burla,
un riducule construction intellectual sin alicun interesse — e
con un agenda moral dubitose (forsan promover le superioritate europee
o qualcosa de iste gusto ?) ; e de omne modo, toto le mundo parla
anglese (o lo parlara tosto…), no ? Pro le zelotes del
interlingua, es un fabulose medio de assemblar le patrimonio commun
del populos habente un lingua latin e de poter parlar insimul qualcosa
altere que le anglese.
Io non ha un aviso sur le subjecto ; io crede que le interlingua es
simplemente un lingua divertente, satis elegante (multo plus que le
esperanto, in mi opinion) e sin pretension. Naturalmente, si nemo lo
parla, su interesse practic es… debile ; ma io nunquam ha
apprendite un lingua pro su interesse practic ,
solmente pro the fun of it.
On debe admitter que le interlingua es facilissime a intender
— etiam sin lo haber studiate — si on cognosce jam un
lingua latin, o forsan mesmo le anglese : certemente plus facile (a
intender) que le italiano, le espaniol o le francese. Le prova : vos
ha intendite iste texto ben que vos probabilemente non lo
cognosceva. Io me demanda (ma non seriosemente,
reassecura vos) an io deberea scriber entratas de iste 'blog in
interlinga plus tosto que in anglese pro los traducer postea in
francese.