Savez-vous ce que sont les signes diacritiques ? Leur nom sonne comme un symptôme de maladie, mais ça ne s’attrape pas, promis. Les signes diacritiques, du grec diakritikos, "qui distingue", ce sont tous ces petits signes qui sont ajoutés aux lettres pour en modifier la prononciation ou le sens.
Ils ne sont que cinq en français. Il y a ceux qui se placent au-dessus des lettres, les accents grave, aigu et circonflexe, mais aussi le tréma, comme sur le e de "Noël", et il y a la cédille, le seul signe diacritique qui se place sous une lettre.
Ces signes n’ont pas toujours existé, on a commencé à les introduire à la Renaissance, quand il est apparu que les lettres héritées du latin ne permettaient pas de reproduire assez fidèlement les sons du français. Le premier signe a été le "é".
Les règles de leur emploi sont strictes : on peut mettre sur un o ou un i un accent circonflexe, mais il ne vous viendrait pas à l’idée d’y mettre un accent aigu en français, alors que cela se fait en espagnol, par exemple. En revanche, jamais d’accent sur les consonnes en français, la seule qui puisse être équipée d’un signe diacritique étant le c avec sa petite cédille.
D’autres langues disposent donc d’autres signes diacritiques. Il y a le rigolo petit rond sur le a suédois, qui s’appelle joliment le "rond en chef". Il y a aussi le o barré en norvégien, et, plus connu chez nous, le tilde espagnol, cette petite vague sur le n qui fait qu’il se prononce "gne" au lieu de "ne". Et c’est justement lui qui m’a donné l’idée de vous parler diacritiques aujourd’hui.
Cette semaine, je corrigeais au journal Le Monde un article dans lequel il était question de Laurent Nunez, secrétaire d’État auprès du ministre de l’intérieur. Je suis allée vérifier l’orthographe de son nom parce qu’il me semblait qu’il avait un tilde sur le n, d’habitude. Là, il n’y était pas. Et alors, impossible de savoir ! On trouve des documents disant que Laurent Nuñes tient au tilde, et étrangement, sur le portail du gouvernement, son nom ne le porte pas.
Ce qui est amusant, c’est qu’il est entré au gouvernement à l’automne dernier, juste au moment où se jouait en Bretagne une tragédie judiciaro-familialo-bretonnante autour du tilde. Car figurez-vous que le tilde existe en breton, et que des parents qui voulaient appeler leur bébé Fañch, avec un tilde sur le n, se le sont vu interdire, au motif que ce signe n’est pas français. Ils sont pourtant parvenus à démontrer que le tilde existait en ancien français, et l’affaire est en appel. Mais c’est peut-être pour éviter que les Bretons puissent se servir de l’argument Nunez que celui-ci s’est scalpé le n en entrant au gouvernement. En tout cas, vous voyez que ces tout petits signes soulèvent parfois de grandes passions.
Peut-on écrire le verbe « entraîner » sans accent circonflexe ? Non, pense encore une bonne partie de nos concitoyens. Pourtant, depuis 1990, ce signe n’est plus obligatoire sur les lettres « i » et « u », sauf dans les terminaisons verbales (exemple : qu’il dût, qu’il fût) et les cas où cela induirait une confusion de sens (exemple : mûr/mur).
Cette évolution fait partie d’un ensemble de modifications de l’orthographe publiées au Journal officiel en 1990, dont voici une synthèse :
Résumé des rectifications orthographiques de 1990. Journal Officiel de la République française
Les rectifications touchent quatre points précis : le trait d’union, le pluriel des noms composés, l’accent circonflexe et le participe passé des verbes pronominaux. Dans le détail, on peut signaler aussi :
la généralisation du trait d’union à tous les numéraux formant un nombre complexe
l’emploi du È pour transcrire le son « e ouvert » pour tous les verbes se terminant en -eler ou -eter (à l’exception de appeler et jeter)
la graphie nénufar, qui a fait couler beaucoup d’encre, alors que ce mot s’est écrit ainsi jusqu’en 1932.
Bref, des modifications raisonnables et très limitées, visant à rendre l’orthographe plus régulière et donc la langue écrite accessible à tous. Mais comme le souligne une enquête menée en 2010, les étudiants et enseignants français sont assez peu nombreux à les connaitre, en tout cas nettement moins nombreux que les Belges, Suisses et Canadiens. Et ils sont peu nombreux à les appliquer.
Cela provient du fait qu’une fois ces modifications actées, le pouvoir politique français n’a pas fait beaucoup d’effort pour les promouvoir auprès des enseignants. Or, si les professeurs ne les transmettent pas en classe, comment cette nouvelle orthographe pourrait-elle se retrouver dans l’usage ? On peut aussi signaler que les dictionnaires usuels ont mis un certain temps à les faire apparaitre et qu’aucun journal de référence français ne les applique. Et la virulente campagne de dénigrement relayée par les journaux, chaines de télévision et radio a eu un fort impact négatif.
Deux événements importants ont été à l’origine des rectifications de 1990. Tout d’abord, une prise de position de la part de professeurs d’écoles et de collèges réclamant une simplification de l’orthographe. Ensuite, un appel en faveur d’une modernisation de l’orthographe est signé par dix linguistes et paru dans le journal Le Monde en 1989. Le pouvoir politique s’empare alors de la question par l’entremise du premier ministre de l’époque, Michel Rocard.
Pour arbitrer, il fait appel à trois instances, à savoir l’Académie française, le Conseil supérieur de la langue française et un comité d’experts. Michel Rocard prend une position active et volontariste dans l’entreprise. Le comité d’experts se met au travail le 12 décembre 1989 et rend un rapport quatre mois plus tard. Ce rapport contient les propositions de rectifications que les membres du comité d’experts jugent pertinentes. L’Académie française l’approuve à l’unanimité des présents. Le premier ministre les soutient également.
Il est alors prévu que ces rectifications soient enseignées dès la rentrée 1991. Sans toutefois les imposer aux adultes qui pourront conserver l’ancienne orthographe en attendant que la nouvelle se généralise. Le texte est publié au Journal officiel le 6 décembre 1990. Les réactions médiatiques hostiles furent presque immédiates. Allant jusqu’à un retournement spectaculaire de la position des membres de l’Académie française.
Pour finir, la circulaire ne fut pas publiée, contrairement à ce qui était prévu. Il faudra attendre 18 ans pour que les rectifications apparaissent timidement dans les programmes scolaires. Et 8 ans de plus pour que les manuels scolaires les adoptent, ce qui a eu pour conséquence de relancer les hostilités.
Ces écueils ne représentent pas des exceptions. Depuis plus d’un siècle, toutes les propositions de modification de l’orthographe se sont heurtées à des campagnes de dénigrement. Or il faut bien voir que des strates de rectifications ont été empilées au cours des siècles sans vue d’ensemble.
Cela a abouti à de multiples sous-systèmes pas toujours cohérents entre eux. D’où l’importance d’actualiser périodiquement notre orthographe afin de la rendre plus régulière. Sans parler du fait que si on ne le fait pas, on s’éloigne lentement mais sûrement de la prononciation.
Pour des raisons historiques, le français avait une orthographe très proche du latin, dont il est issu. C’est la raison pour laquelle il possède un certain nombre de lettres étymologiques muettes. Certaines de ces lettres étymologiques ont d’ailleurs été réintroduites alors qu’elles avaient disparu ou bien ont été supprimées. C’est le cas dans tiLtre et aDvocat. De plus, l’alphabet du français est directement hérité de celui du latin. Or, le français comporte plus de sons que le latin. Pour compenser cela, on y a ajouté quelques lettres ainsi que des accents et la cédille.
Ces ajouts ont été décidés par des grammairiens et imprimeurs codifiant la transcription de notre idiome. Il faut en plus ajouter, aux divers procédés orthographiques utilisés, le recours à la combinaison des lettres pour transcrire un son : CH, EAU, OU, ON, etc. Et aussi l’importance accordée à la différenciation des homographes, c’est-à-dire au fait de distinguer, par la forme graphique, des mots se prononçant de la même façon comme vert, verre, vers, ver. La liste des mots possédant un pluriel irrégulier est également touchée par ces choix, ainsi qu’un ensemble de règles d’orthographe grammaticale : conjugaisons des verbes, absence d’accord quand on a affaire à un substantif épithète (des rideaux orangE)…
Ce très rapide tour d’horizon montre bien que l’orthographe française est le résultat de choix, et non d’une évolution naturelle. Bien sûr, on peut critiquer, à raison, tel ou tel cas modifié en 1990. Par exemple, on peut se demander pourquoi le comité d’experts a décidé de conserver certaines exceptions plutôt que d’élaborer des règles systématiques. Mais il ne faut jamais perdre de vue que l’on a besoin de rendre notre orthographe plus régulière et donc plus accessible. C’est un enjeu démocratique majeur à une époque où l’écrit est indispensable et où l’on souhaite agrandir la famille de la francophonie.
Les étymologies fantasmées en disent beaucoup sur ce que pense la personne qui les imagine. C'est le cas de Lorànt Deutsch, mais on peut aussi en rire avec Isidore de Séville.
Après avoir sévi pendant des années en histoire, Lorànt Deutsch a sorti un livre sur la langue française, Romanesque. Après avoir bien ri et vanné mes amis linguistes («bien fait pour vous, chacun son tour»), j’ai quand même regardé un peu ce qu’il y disait.
Et je suis notamment tombé sur cette pépite: selon Lorànt Deustch, le mot «femme» viendrait du latin femina, lui-même dérivé du latin fellare, sucer –il s’empresse de préciser «pas au sens trivial», mais en lien avec la tétée du nourrisson.
Et l’auteur de conclure que du coup, ce mot n’est pas du tout approprié quand on veut défendre la libération de la femme, et qu’il vaudrait mieux utiliser «dame», dérivée de domina, la maîtresse, et donc parler de «damisme» et non de féminisme.
Bon, des linguistes et des spécialistes de la langue française diront mieux que moi que cette étymologie est absolument délirante. Et qu’elle est regrettable, car, bien menée, l’étymologie est une vraie science très utile pour mieux comprendre les mots.
Ce qui est intéressant, d’un point de vue d’historien, c’est que cette passion pour l’étymologie est, pour le coup, partagée par les hommes du Moyen Âge.
Au VIIe siècle, un auteur espagnol, Isidore, évêque de Séville, rédige un très gros livre intitulé Les Étymologies. Il s’agit d’un traité sur le sens des mots via leur étymologie.
Pour Isidore, remonter à la racine permet de mieux comprendre un mot: en grec, etymon veut dire «authentique», et à l’époque, l'étymologie est pensée comme une véritable démarche scientifique.
Isidore entreprend de retracer l’histoire de près de 100.000 mots –à titre de comparaison, le Petit Robert en contient environ 60.000.
Le résultat est l’un des plus gros succès de librairie de tous les temps: plus de mille manuscrits conservés pendant toute la période médiévale, et des éditions imprimées dès les premiers temps de la nouvelle technique.
Précisons d’emblée que, dans ce livre, Isidore fait souvent preuve d’esprit critique: il est tout à fait capable de critiquer une étymologie jugée trop fragile, et ne rate jamais une occasion de s’en prendre aux superstitions païennes de son époque.
Il faut également bien rappeler qu’Isidore n’invente pas tout: au contraire, il puise dans plus de 150 sources antiques et tardo-antiques, recopiant souvent des étymologies que l'on trouvait déjà chez Virgile, Servius, Ovide, Eusèbe de Césarée, etc.
Dans les milliers d’étymologies qu’Isidore propose, plusieurs sont tout à fait correctes et encore reconnues comme valides aujourd’hui.
Le problème, c'est que la méthode d'Isidore est souvent très fragile: il rapproche des mots, sur la base d’une homonymie plus ou moins précise, et pouf, ça donne une étymologie.
Par exemple, «Saxons» viendrait de saxum, le rocher. Les Saxons étant un peuple dur, on les a appelés comme un caillou. Si à ce stade vos sourcils se froncent d’eux-mêmes, pas de panique, c’est normal.
Son passage sur les animaux (livre XII) est le plus drôle. On y apprend que le renard, vulpes, est appelé ainsi car il est agile (volubilis) sur ses pieds (pedes). Vous combinez les deux mots, et ça donne –avec un peu de bonne volonté, mais faites un effort ou on ne va pas s’en sortir!– vulpes.
Plus tordu: la fourmi, en latin formica –comme le revêtement, voilà voilà. Le mot dériverait de fert micas, «elle porte des graines»...
Allez, je sens que vous en voulez encore. Un peu en vrac, vous apprendrez que l’agneau vient de agnoscere, reconnaître, car le petit agneau reconnaît toujours sa mère; que le chien, canis, tire son nom du bruit (canor) qu’il fait en aboyant; que le mot «crocodile» est issu de «crocus», autrement dit le safran, qui lui donne sa couleur –oui, pour Isidore, les crocodiles sont jaunes, c’est comme ça.
La plupart des étymologies viennent du latin et du grec, mais Isidore est tout à fait conscient qu’il existe d’autres langues. «Tigre» viendrait ainsi d’un mot perse voulant dire «flèche», car l’animal est aussi rapide qu’une flèche. On croise également des animaux fantastiques, perçus comme bien réels à l’époque: le griffon vient de la combinaison de grus, la grue, et pedes, les pieds, car c’est un animal avec des plumes et des pattes.
Ces étymologies ne sont pas que délirantes –ou plutôt, même ces délires en disent long sur l’auteur et sa vision du monde. On voit par exemple qu'Isidore relie très souvent l’étymologie d’un nom d’animal au comportement de cet animal: la vipère est «née par la force» (vi parere), car les bébés vipères déchirent le ventre de leur mère en naissant, et qu’avant, la maman vipère a mangé le papa vipère. La façon dont il pense les mots renvoie à la façon dont il pense le monde animal.
Ses étymologies en disent également long sur le monde dans lequel Isidore vit. On apprend par exemple que Vénus, la déesse de l’amour, tire son nom du latin vis, la force, «car aucune vierge ne cesse de l’être si ce n’est par la force».
D’ailleurs, «homme», en latin vir, vient également de vis, toujours la force, «car en lui il y a une plus grande force qu’en la femme ou car il traite sa femme par la force». L’homme est violent, la femme est violentée. Hop, derrière une étymologie discrète, une culture du viol banalement constatée et donc renforcée.
Pour le dire autrement, les étymologies d'Isidore, aussi farfelues soient-elles, ne sont pas neutres: elles révèlent des choses et elles justifient des comportements. Ainsi choisit-il de faire dériver loup, lupus, d’un mot grec voulant dire «enragé, sauvage, violent»: le loup est forcément une bête féroce, que l'on doit craindre et exterminer, car il porte la violence dans son nom.
De même, quand Deutsch dit –à tort, répétons-le– que femme vient de fellare, sucer, c’est une façon de renvoyer la femme à un rôle maternel et sexuel. Car même s’il exclut ce sens trivial, reste que tout le monde l’a en tête. Le loup est enragé; la femme suce et donne à téter. Les deux, malgré leurs efforts, ne pourront jamais vraiment échapper à leur nature, inscrite au cœur des mots qui servent à les désigner.
Les étymologies fantasmées en disent ainsi beaucoup sur ce que pense celui qui les imagine. Elles sont assez dangereuses, car elles proposent des codes génétiques des mots, comme si on ne pouvait pas changer le sens d’un terme: ce qui compte, c’est son origine. D’où il vient. Ses racines, quoi. Et l'on devine à quel point cette obsession pour les racines linguistiques peut rejoindre un fantasme des racines historiques.
Laissons le mot de la fin à Isidore: racine, radix, viendrait de eradere, «arracher, couper». On ne saurait mieux dire… À vos bêches, camarades!
a Commission d'enrichissement de la langue française a publié au Journal Officiel ce jeudi 4 octobre une série de termes à utiliser à la place de l'expression "fake news".
Vous avez l'habitude d'employer le terme "fake news"? Et bien ne le faites plus.
C'est en tout cas ce que souhaite la Commission d'enrichissement de la langue française (CELF), chargée de proposer des termes français pour maintenir la fonctionnalité de notre langue.
Cette commission a publié une recommandation sur les équivalents à donner à cette expression au Journal Officiel ce jeudi 4 octobre.
plusieurs propositions
Chers Français, vous pouvez donc désormais employer le terme "information fallacieuse" ou le néologisme "infox", fusion des mots "information" et "intoxication".
La CELF vous propose également "nouvelle fausse", "fausse nouvelle", "information fausse" ou "fausse information", termes figurant déjà dans la loi de 1881 sur la liberté de la presse ainsi que dans les codes électoral, pénal et monétaire et financier.
Des expressions à utiliser "lorsqu’il s’agit de désigner une information mensongère ou délibérément biaisée, répandue par exemple pour favoriser un
parti politique au détriment d’un autre, pour entacher la réputation d’une personnalité ou d’une entreprise, ou encore pour contredire une vérité scientifique établie", indique l'avis publié au Journal Officiel.
pas obligatoire
La recommandation de la CELF n'a de caractère obligatoire que pour les administrations et les établissements de l'Etat. Elle peut servir de référence, notamment pour les traducteurs.
"En tout état de cause, la Commission d’enrichissement de la langue française recommande l’emploi, au lieu de fake news, de l’un de ces termes, choisi en fonction du contexte."
Nous utilisons de plus en plus la technologie pour communiquer dans une autre langue. Mais les logiciels de traduction se heurtent à quelques obstacles.
Un sondage du British Council, une institution gouvernementale du Royaume-Uni dédiée à la promotion de la langue anglaise, a montré que 60% des 16-34 ans utilisent les applis de traduction sur leur smartphone lorsqu’ils ou elles sont à l’étranger.
Pendant la Coupe du monde cet été en Russie, Reuters avait fait un reportage sur l’omniprésence de Google Translate, utilisé par les supportrices et supporters des différentes nations pour communiquer. Son utilisation avait alors augmenté de 60%, notamment pour traduire les mots «stade» et «bière».
En mars, Microsoft a annoncé que son intelligence artificielle avait réussi à atteindre des performances humaines en termes de traduction. C’est-à-dire que des articles de presse ont été traduits du chinois vers l’anglais par une machine, aussi bien que l’aurait fait un traducteur ou une traductrice de chair et de sang.
Toutefois, quiconque a déjà tenté de rendre un devoir d’espagnol fait à la dernière minute sait que ces applications sont loin d’être entièrement fiables. L'expression n’est pas assez fluide et il existe de nombreux bugs. Numérama montrait en juillet que lorsqu’on tape du charabia dont on demande une traduction depuis une langue mal connue, le logiciel se met à prêcher des incantations à tonalité pseudo-biblique. Par exemple, vingt-cinq fois la syllabe «ag» traduite depuis le maori donne la phrase «À quel point une avidité gourmande est-ce que nous voulons être?»
En fait, ce bug permet de comprendre comment fonctionnent les logiciels de traduction. Plutôt que de piocher chaque mot individuellement dans une base de données, Google Translate et les autres utilisent le deep learning («apprentissage profond»), une sorte d’intelligence artificielle pensée pour s'approcher de la manière dont les humains réfléchissent. La machine compare son premier jet à des traductions humaines pré-existantes et se corrige en conséquence. Ainsi, l’algorithme apprend de ses erreurs et se perfectionne tout seul.
Le rapport avec le bug évoqué plus haut? Lorsqu’il existe peu de traductions entre deux langues (le français et le maori par exemple) le logiciel se réfère aux rares existantes. Et au moins un texte est traduit dans toutes les langues: la Bible. D’où le sermon sur l’avidité cité précédemment.
Ce dysfonctionnement illustre aussi une impasse du deep learning. Lorsqu’une langue n’a pas beaucoup été traduite par des humains, les logiciels ne disposent pas d'assez de ressources pour apprendre. Microsoft peut donc traduire de manière très performante le chinois vers l’anglais car ce sont les langues les plus utilisées au monde et que son IA peut piocher dans un très large éventail de traductions. Ce ne serait pas possible avec des langues peu documentées.
Une autre impasse est la rapidité de l’évolution des langues. Les résultats obtenus par Microsoft se basaient sur des articles de presse, soit une écriture relativement classique et codifiée. Ce n’est pas le cas des langues courantes. Par exemple, un vieux manuscrit traduit du français à l’anglais ne va pas du tout ressembler au français parlé d’aujourd’hui. La machine sera confuse devant la différence de fond comme de forme des deux textes qui sont pourtant écrits dans la même langue.