17/05/2025

Taiwan Today

Taiwan aujourd'hui

Le chinois, une langue moderne

01/05/1990
Clavier chinois incorporé au clavier qwerty.

Nous appelons au sens large du terme les appareils qui peuvent traiter des données en langue chinoise, les ordi­nateurs de langue chinoise. Mais peuvent-ils traiter de telles informations puisque la structure de la langue écrite chinoise est totalement différente des diverses langues alphabétiques occiden­tales ou orientales. Les alphabets répon­dent à un système de transcription lin­guistique qu'ignore le chinois. Un mot écrit est formé d'un certain nombre de lettres et la longueur des mots qui est fonction de sa prononciation n'est pas nécessairement identique et peut comp­ter jusqu'à plusieurs lettres. Ainsi quelques signes ou lettres peuvent défi­nir des millions de mots de tout un voca­bulaire. En revanche, la langue chinoise écrite a une structure idéographique. Elle possède donc des milliers de signes ou caractères qui ont chacun une forme indépendante, une prononciation mono­syllabique non représentée graphique­ment et une sémantique, toutes bien déterminées. C'est justement à cause de cette particularité des caractères indépen­dants les uns des autres et de leur plura­lité que les Chinois ont rencontré d'énormes difficultés au cours de l'infor­matisation de leur langue.

A Taiwan, les premiers pas de l'ordi­nateur du chinois remontent à 1971. En ce temps-là, des unités de recherches et des spécialistes, ayant compris la nature importante du traitement informatique, étudièrent donc les possibilités d'utilisa­tion de traitement informatique du chinois. Comme les autres pays, les re­cherches initiales de Taïwan mirent aussi l'accent sur la procédure d'entrée/sortie (E/S), c'est-à-dire l'introduction des données en chinois dans l'ordinateur et la sortie de ces mêmes données une fois traitées. A cause de la nature particulière des caractères chinois, leur temps d'introduction dans l'ordinateur n'est pas aussi rapide que pour les lettres al­phabétiques. C'est pourquoi, beaucoup de spécialistes se sont jetés avec enthou­siasme dans la recherche d'une procé­dure d'entrée du chinois. Après 1980, plusieurs procédures d'entrée, les plus singulières les unes que les autres, avaient vu le jour. Parmi elles, on peut noter la grande vitesse des procédures d'entrée différemment spécialisées, ainsi que leurs facilités d'entraînement. Vers 1983, hormis le lancement de systèmes d'exploitation en chinois, se sont développées dans la foulée toutes sortes de progiciels pratiques pour le traitement de données en chinois. C'est là un im­mense progrès de la « sinisation » de l'ordinateur. Il faut également compter la mise en place de systèmes de composi­tion et de reproduction de caractères chinois qui ont eu une influence heu­reuse sur toute l'industrie de l'imprimerie.

a une histoire fort longue et une civilisation magnifique, et tous les caractères écrits qu'elle possède s'élè­vent au moins à quelque 50 000 signes. Et pour l'emploi quotidien, environ cinq mille caractères, les plus usuels, sont né­cessaires. Ainsi, la capacité minimale d'un ordinateur devra donc être de dix mille caractères pour pouvoir traiter nor­malement des données. Or, justement, le recueil des caractères chinois de base comprend 13 051 idéogrammes ou signes différents. Il sera alors le vocabu­laire idéal d'un ordinateur du chinois. Outre la capacité de traiter tous les caractères du recueil fondamental, les sys­tèmes d'exploitation des ordinateurs du chinois, dans leur ensemble, doivent également pouvoir disposer au moins de deux procédures d'entrée pour satisfaire la demande de l'utilisateur. Cependant, à cause du grand nombre de signes ou ca­ractères, l'ordinateur ne peut guère être parfaitement performant. Aussi tout pro­giciel incorporé devra aussi posséder une capacité qui permette à un utilisateur de frapper ou de créer tout seul les carac­tères dont il a besoin. Cet utilisateur pourra alors en fonction de chaque de­ mande personnelle fabriquer les carac­tères ou les signes que le système n'aura pas mémorisé.

Hao Chen-tai Grand clavier chinois (partie).

L'entrée du chinois
Comme les caractères chinois sont d'origine pictographique, tous les carac­tères, simples ou composés ultérieure­ment, ont une forme indépendante et unique et ne ressemblent en aucun cas aux mots écrits avec des signes phoné­tiques. En effet on peut écrire et sortir d'innombrables mots avec un nombre très restreint de lettres alphabétiques. C'est pourquoi, les procédures d'entrée du chinois ne ressemblent pas du tout à ceux des lettres alphabétiques. Avant 1979 à Taiwan, beaucoup de spécialistes se sont penchés sur les procédures d'entrée des caractères entiers. Mais cette procédure exige beaucoup de temps d'utilisation au moyen d'un immense clavier. En effet, dans cette procédure, l'utilisateur doit d'abord repérer l'empla­cement du caractère sur ce grand clavier qui comprend des rangées de milliers de caractères pour pouvoir en frapper la touche et l'introduire dans l'ordinateur. Comme le nombre de caractères, néces­saires au traitement informatique en chinois, atteint plus de 13 000 signes, la surface d'un tel clavier est démesurée. Même avec l'idée d'une division pra­tique du clavier, les caractères sont alors répartis sur plusieurs plaques, selon leur fréquence et leur spécificité d'utilisation. Il n'empêche que la surface occupée de­meure toujours trop grande, et la frappe des caractères fort peu commode. Ce type de grand clavier utilisable dans la procédure d'entrée ne saurait contenir dans un clavier alphabétique normal de l'ensemble des ordinateurs. De plus, la vitesse d'entrée étant plus lente, son extension est peu aisée. C'est pourquoi cette procédure d'entrée des caractères entiers n'est plus aujourd'hui utilisée, excepté dans un petit nombre d'entreprises.

Il a donc fallu analyser la structure des caractères chinois, en les décomposant en divers radicaux structuraux. C'est la procédure d'entrée que l'on ren­contre plus couramment aujourd'hui. Selon les données statistiques de fré­quence, ces radicaux ont été repartis sur les touches du clavier qwerty (anglo­américain) ou bien définis selon un code. C'est la procédure d'entrée des ra­dicaux idéographiques. Chaque fois qu'il s'agit d'introduire des caractères chinois dans l'ordinateur, il suffit de frapper la touche correspondante des radicaux composant ledit caractère ou bien de taper leur code à la manière des lettres d'un mot alphabétique. Comme l'analyse des caractères par radicaux n'est pas uni­forme, on a utilisé des formules de divi­sion différentes, d'où l'existence de plu­sieurs procédures d'entrée. Il faut que les radicaux soient tous bien distribués sur les touches du clavier qwerty normal. Se conformant à ces touches, il suffit alors d'utiliser un clavier normal pour introduire les caractères selon la procédure en place, ce qui est beaucoup plus commode que les procédures d'entrée sur grands claviers dont la plu­part sont beaucoup trop larges pour être adoptés.

Hao Chen-tai Dactylos devant leur « immense» clavier.

A l'heure actuelle, le progiciel Tsang-jié (du nom de l'inventeur my­thique de l'écriture chinoise) est certai­nement la principale procédure d'entrée par radicaux utilisée à Taïwan. Presque tous les logiciels du chinois ont adopté ce type de procédure. Dans le progiciel Tsang-jié, il n'est utilisé que 25 touches, de A à Y. Comme il repose sur un clavier normal, tous les matériels peuvent l'utiliser pour introduire le chinois. Par exemple, pour introduire les deux carac­tères ming-t'ien 明天 (demain) dans l'ordinateur selon ce programme, il faut décomposer les deux caractères comme suit. Le premier caractère ming se divise en radical je 日 sur la lettre A et en radical yué 月 sur la lettre B, tandis que le second caractère t'ien se divise à son tour en deux radicaux, yi sur la lettre M et ta 大 sur la lettre K. Ainsi, après avoir accédé au progiciel Tsang-jié, la frappe des lettres A et B donne le caractère ming et celle des touches M et K donne le caractère t'ien. Ici les caractères sont simples et correspondent chacun à deux touches pour les introduire dans l'ordi­nateur et y former le terme ming-t'ien (demain) .

Bien sûr, les procédures d'entrée par radicaux ont toutes un code d'application pour pouvoir être opérables. Comme cette nouvelle définition de l'écriture est quelque peu éloignée de ce que les Chinois ont appris à l'école, il est néces­saire de suivre une courte formation pour pratiquer convenablement cette procédure d'entrée. Il se fait donc une sélection de l'utilisateur. Pour y pallier, il existe une autre procédure d'entrée par la prononciation des caractères. Chaque caractère est aussi fondamenta­lement défini non plus par sa forme mais par sa prononciation à l'aide des sym­boles phonétiques du kouo-yu (langue nationale chinoise) ou Tchou-yin. Ce système Tchou-yin qui comprend 37 signes représentant les consonnes et les voyelles simples ou combinées, plus 4 signes pour marquer les tons, a permis de fixer la prononciation de tous les ca­ractères chinois. Or, tout le monde à Taïwan a appris ce système à l'école pri­maire et sait pratiquement l'employer. Aussi, a-t-on pensé l'utiliser dans les procédures d'entrée du chinois dans l'ordinateur. Sans formation particulière, l'utilisateur est immédiatement apte d'introduire tout caractère par les sym­boles Tchou-yin, ce qui est un point très important. Cependant, comme il existe de nombreux caractères homophones, un même son regroupera plusieurs carac­tères. Ainsi, après l'affichage de tous les caractères d'un même son et même ton sur le moniteur, il suffira dans un deuxième temps de frapper le caractère répertorié pour l'introduire dans l'ordi­nateur. Il est également facile de réduire la vitesse d'entrée, et la personne initiée sensible à la vitesse d'entrée pourra adopter un style de frappe approprié. Pour satisfaire les différentes demandes, la plupart des systèmes d'exploitation du chinois actuels possèdent à la fois les pro­giciels Tsang-jié et Tchou-yin. Avec le progrès technique des logiciels et le renforcement fonctionnel des maté­riels et périphériques, on a adopté une technologie industrieuse et ingénieuse en l'accordant aux principes phoné­tiques, linguistiques et autres, particu­liers au vocabulaire chinois. Ainsi, la technique actuelle peut déjà à partir de plusieurs caractères homophones sélec­tionner le caractère désiré. Comme on peut en outre créer les quelques carac­tères homophones qui font défaut au progiciel Tchou-yin, on peut penser qu'à l'avenir la procédure d'entrée par la pho­nétique sera acceptée plus aisément par l'ensemble.

Exemples de style de caractères issus d'une imprimante d'ordinateur.

La sortie des caractères chinois
Après l'entrée dans l'ordinateur, le chinois qui s'affiche sur l'écran d'un or­dinateur doit pouvoir se visualiser sur un autre support, et même s'imprimer. C'est un problème d'une plus grande complexité. Avant tout, il faut savoir que la forme de tout caractère chinois se trace dans un carré, en conséquence, quel que soit le nombre de traits qui le compose, la surface utilisée par tout ca­ractère sera identique. Ainsi, le caractère yi (un) de 1 seul trait et le caractère désuet t'a 龘 (marche du dragon) de 48 traits seront tracés sur l'écran dans un même espace. Pour cette raison, un ou plusieurs mêmes radicaux différemment arrangés dans des caractères différents peuvent varier en grandeur. Leur taille doit alors se conformer à la structure gé­nérale du caractère. Cela rend donc les radicaux chinois difficiles à tracer dans une méthode qui veut les rassembler. C'est pourquoi, les écrans d'ordinateur du chinois utilisent presque tous une ma­trice à points pour l'affichage des carac­tères. De plus, pendant des milliers d'années de la longue histoire de , un grand nombre de caractères ont été modifiés en des formes tout à fait différentes. Dans l'arrangement de textes ordinaires, pour leur conserver une esthétique et une originalité, notam­ment dans les tseu [辭], un terme, on a souvent mélangé les formes, les styles et les tailles des caractères. Cela a donc créé toutes sortes de caractères parmi lesquels les utilisateurs ont pu choisir. C'est une fonction que l'ordinateur du chinois a également besoin de disposer. Cependant, l'utilisation de la matrice à points pour afficher les formes et styles variés de caractères de toute taille et leur stockage dans l'ordinateur exige un dis­positif de mémoire de grande consom­mation. Dans la technologie actuelle, ce n'est pas encore un moyen très écono­mique. Avec la recherche active de ces dernières années à Tàiwan, il existe un immense marché de progiciels de créa­tion de caractères. Ces séries de pro­grammes n'ont actuellement que de trois styles différents d'écriture capables de créer des formes les plus diverses. De plus, il y a eu un effet positif considérable sous la forte influence des systèmes japo­nais de haute qualité.

Huang Chung-hsin (A gauche) Menu d'un progiciel chinois.(A droite) Structuration agrandie d'un caractère sur écran.

L'application informatique du chinois
Aujourd'hui, l'application informa­tique du chinois lancée à Taïwan qui s'est structurée et développée en fonc­tion des systèmes d'exploitation du chinois s'est intéressée à l'entrée et la sortie du chinois puisque ces systèmes en font le traitement complet. Cette ap­plication n'a fourni à l'utilisateur qu'une fonction pratique dont la formule en chinois s'est développée. Elle embrasse les affaires de personnel, les salaires, la comptabilité, les stocks, les archives, et s'étend jusqu'au domaine informatique bancaire. On peut aujourd'hui utiliser le chinois un peu partout. On peut dire que l'ordinateur s'est étroitement intégré dans la vie. Il convient de souligner la dé­couverte de la composition assistée par ordinateur qui a eu une si grande réper­cussion sur toute l'industrie de l'impri­merie de Taïwan. A partir de 1987, les journaux de Taïwan ont peu à peu aban­donné les méthodes anciennes et tradi­tionnelles de mise en page pour la composition informatisée. Cela a énor­mément réduit le temps de la rédaction et de la composition des journaux. Der­nièrement, c'est certainement grâce à ces compositions assistées par ordinateur que tout s'est ébranlé, sans parler de la création de formes idéographiques dont on a parlé plus haut. La composition, selon le kien-tseu [檢字] traditionnel, le classé indexé des caractères, a donc peu à peu été remplacée par l'ordinateur.

Les difficultés rencontrées
En observant le développement des ordinateurs du chinois à Taïwan, c'était il y a dix ans encore une phase de re­cherche et d'étude. Pour le traitement du chinois par l'ordinateur, en particu­lier, et une informatisation du chinois, en général, il aura fallu un peu plus de cinq ans pour l'étude de la sortie du chinois. Depuis 1983, l'évolution de l'ordinateur en chinois à Tàiwan a entamé la deuxième période: l'informa­tisation du chinois proprement dite, avec le traitement de textes et docu­ments chinois et la conversation par ordi­nateur en cette langue. Il s'agit d'un point important puisqu'on assiste juste­ment à la « sinisation » des système d’exploitation.

Pour l'introduction du chinois dans l'ordinateur, dès le départ on a réelle­ment rencontré d'énormes résistances, mais les spécialistes ont fait de rudes ef­forts pour développer différentes procé­dures d'entrée spécialisées de tout ordre afin de parvenir à une vitesse d'entrée de 90 caractères par minute. Quant à la résistance qui planait sur ce domaine s'est nettement affaiblie. Il y a toujours une assez grande incertitude dans le nombre des caractères chinois à utiliser. Bien que le « recueil national des carac­tères chinois » en contienne 13 051, le nombre des caractères nécessaires aux systèmes des bibliothèques et de la tenue de l'état civil dépasse de loin ces chiffres. Dans la tenue de l'état civil, ce problème est extrêmement important. En voici la raison : les Chinois croient fermement que la vie est le reflet de la connaissance. Beaucoup, dans le choix d'un nom, ont aimé créer un nouveau caractère. Et pour l'informatisation du chinois, chaque caractère est défini par un code pour s'afficher dans l'ordina­teur, encore faut-il pouvoir y ajouter tous les nouveaux caractères. La concep­tion des systèmes d'exploitation du chinois aura donc une influence considé­rable. Heureusement, grâce à l'élévation du niveau d'instruction, le taux de créa­tion de nouveaux caractères a beaucoup diminué, ce qui a rapidement permis aux conceptions des programmes de se stabi­liser. Toutefois la phase pendant laquelle la technologie a pu s'épanouir a ren­ contré un nouveau problème: la norma­lisation. Avant le développement de l'ordinateur du chinois, par manque de normalisation, on a énormément dépensé de ressources humaines. En effet, l'informatisation un peu désordon­ née du chinois qui en a ralenti l'allure est justement en rapport étroit avec la normalisation.

Le développement futur
Parallèlement aux progrès de la fonc­tion que l'ordinateur est appelé à prendre, de nombreux spécialistes se sont lancés dans la recherche de la recon­naissance du discours et celle des carac­tères chinois pour parvenir à un moyen plus naturel et un objectif lié à l'ordina­teur. La technique dans le domaine lin­guistique, quoiqu'encore non parvenue à une phase productrice, a obtenu des ré­sultats remarquables, comme ses expé­riences dans l'aide aux aveugles par l'uti­lisation de l'ordinateur. La technique dans le domaine de la distinction des formes imprimées de caractères est, elle, vraiment entrée dans une phase productive qui prévoit d'ici deux ans que cette sorte de reconnaissance informa­tique pourra servir dans les textes et do­cuments chinois.

Depuis plus de dix ans, le développe­ment des ordinateurs du chinois ont ren­contré beaucoup de difficultés dont beaucoup ont été aujourd'hui surmon­tées, puis résolues. Maintenant, l'usage d'ordinateur du chinois à Taïwan est uni­ versel. Grâce à la dimension du marché de Tàiwan et au progrès technique du traitement de textes chinois, on peut uti­liser avantageusement les normalisations internationales, tout en tenant compte de la demande de Taïwan. Pour encoura­ger l'administration publique à tous les niveaux à se servir des ordinateurs du chinois, la coopération étroite entre le gouvernement, les centres de re­cherches, les secteurs industriel et com­mercial s'est fixée un horizon : la marche vers la normalisation. D'après son expérience passée, Taïwan devrait atteindre rapidement cet objectif puisque le développement de l'ordinateur du chinois est son espoir le plus cher. ■

Les plus lus

Les plus récents