Dans toute langue écrite, les mots font l’objet d’une triple correspondance : la prononciation, l’écriture, et évidemment la signification (ou plus correctement le signifié).
Ainsi, le mot français cheval désigne l’animal de trait et de course, se prononce /ʃə.val/et s’écrit c-h-e-v-a-l.
L’écriture du français étant alphabétique
Par exemple, le mot cheval régulier, toute personne sachant lire saura prononcer correctement ce mot même s’il ne l’a jamais vu écrit auparavant. Comme nous l’explique S. Dehaene, la lecture emprunte ici la voie dite phonologique : les graphèmes sont mécaniquement convertis en phonèmes sans faire appel à des représentations sémantiques plus profondes.
L’histoire est tout autre en ce qui concerne le chinois
L’écriture de toutes les langues chinoises est unifiée dans le système des idéogrammes. Ces caractères chinois se prononcent différemment dans chacune des langues de la superfamille, par exemple dans la plus parlée d’entre elles qui est le mandarin.
L’association entre un caractère chinois et sa prononciation est complètement arbitraire
C’est, en tout cas, souvent affirmé par les non-sinisants. De ce fait, il serait impossible de prononcer un caractère chinois, même lorsqu’on en connait la signification, si l’on n’en a pas appris par cœur la prononciation préalablement.
La réalité est légèrement plus subtile.
Il est le plus souvent indispensable d’apprendre simultanément le caractère et la prononciation de tout mot chinois
Mais il faut souligner que 80 à 90% des caractères chinois sont en fait des caractères composés. Ils comportent une racine phonétique (il y en a à peu près 200) et une racine sémantique (il y en a environ 1000).
La racine phonétique, généralement du côté droit du caractère composé, peut donner des indications sur la prononciation du mot.
La racine sémantique, souvent à gauche, renseigne-t-elle sur le sens du mot, au moins en indiquant la catégorie lexicale à laquelle il appartient.
Par exemple, le mot cheval s’écrit 马 en chinois simplifié et se prononce mă (troisième ton) en mandarin. La mère, elle, se prononce mā ma (ma est redoublé, le premier se prononce avec le premier ton) ; le caractère de chacun des ma se compose à gauche de la racine sémantique de femme et à droite de la racine phonétique de cheval.
Dans un article de 2007, Bao Guo Chen et ses collègues ont démontré que les effets de l’âge d’acquisition sur la lecture du mandarin (pour des locuteurs natifs) étaient d’autant plus importants que l’association son-caractère ou signification-caractère était arbitraire.
Les caractères appris précocement étaient lus aisément ; les caractères appris tardivement étaient d’autant plus difficiles à lire que l’association au sens et à la signification était peu prédictible.
En d’autres termes, plus il était difficile de déduire la signification et la prononciation d’un caractère, plus la qualité et la rapidité de la lecture pâtissaient de l’apprentissage tardif.
Ainsi, au sein même de la langue chinoise et pour des locuteurs chinois natifs, les effets de l’âge d’acquisition croissent avec la nature arbitraire de la correspondance entre signification, prononciation et écriture.
Qu’en est-il des langues alphabétiques ?
Dans celles-ci, on peut par définition avoir une bonne idée de la prononciation d’un mot lorsqu’on le lit.
Or, pris dans sa totalité, la langue chinoise est notoirement plus arbitraire dans ses correspondances que toutes les langues alphabétiques. On peut donc supposer que pour le chinois plus encore que pour les autres langues, il y a intérêt à apprendre la langue précocement afin de ne pas souffrir des effets accentués de l’âge d’acquisition sur la lecture.
Pour en savoir plus :
Chen, B. G., Zhou, H. X., Dunlap, S. and Perfetti, C. A. (2007).Age of acquisition effects in reading Chinese: Evidence in favour of the arbitrary mapping hypothesis. British Journal of Psychology, 98: 499–516. doi: 10.1348/000712606X165484
Stanislas Dehaene (2007). Les neurones de la lecture. Editions Odile Jacob
Note : * La situation varie toutefois de langue en langue. L’italien ou le turc, par exemple, sont extrêmement simples à prononcer à la simple lecture, tandis qu’une même orthographe anglaise peut se lire de multiples façons différentes (il suffit pour s’en convaincre de regarder la prononciation de la finale de tough, through, thorough, etc…)