Nous appelons au sens large du terme les appareils qui peuvent traiter des données en langue chinoise, les ordinateurs de langue chinoise. Mais peuvent-ils traiter de telles informations puisque la structure de la langue écrite chinoise est totalement différente des diverses langues alphabétiques occidentales ou orientales. Les alphabets répondent à un système de transcription linguistique qu'ignore le chinois. Un mot écrit est formé d'un certain nombre de lettres et la longueur des mots qui est fonction de sa prononciation n'est pas nécessairement identique et peut compter jusqu'à plusieurs lettres. Ainsi quelques signes ou lettres peuvent définir des millions de mots de tout un vocabulaire. En revanche, la langue chinoise écrite a une structure idéographique. Elle possède donc des milliers de signes ou caractères qui ont chacun une forme indépendante, une prononciation monosyllabique non représentée graphiquement et une sémantique, toutes bien déterminées. C'est justement à cause de cette particularité des caractères indépendants les uns des autres et de leur pluralité que les Chinois ont rencontré d'énormes difficultés au cours de l'informatisation de leur langue.
A Taiwan, les premiers pas de l'ordinateur du chinois remontent à 1971. En ce temps-là, des unités de recherches et des spécialistes, ayant compris la nature importante du traitement informatique, étudièrent donc les possibilités d'utilisation de traitement informatique du chinois. Comme les autres pays, les recherches initiales de Taïwan mirent aussi l'accent sur la procédure d'entrée/sortie (E/S), c'est-à-dire l'introduction des données en chinois dans l'ordinateur et la sortie de ces mêmes données une fois traitées. A cause de la nature particulière des caractères chinois, leur temps d'introduction dans l'ordinateur n'est pas aussi rapide que pour les lettres alphabétiques. C'est pourquoi, beaucoup de spécialistes se sont jetés avec enthousiasme dans la recherche d'une procédure d'entrée du chinois. Après 1980, plusieurs procédures d'entrée, les plus singulières les unes que les autres, avaient vu le jour. Parmi elles, on peut noter la grande vitesse des procédures d'entrée différemment spécialisées, ainsi que leurs facilités d'entraînement. Vers 1983, hormis le lancement de systèmes d'exploitation en chinois, se sont développées dans la foulée toutes sortes de progiciels pratiques pour le traitement de données en chinois. C'est là un immense progrès de la « sinisation » de l'ordinateur. Il faut également compter la mise en place de systèmes de composition et de reproduction de caractères chinois qui ont eu une influence heureuse sur toute l'industrie de l'imprimerie.
a une histoire fort longue et une civilisation magnifique, et tous les caractères écrits qu'elle possède s'élèvent au moins à quelque 50 000 signes. Et pour l'emploi quotidien, environ cinq mille caractères, les plus usuels, sont nécessaires. Ainsi, la capacité minimale d'un ordinateur devra donc être de dix mille caractères pour pouvoir traiter normalement des données. Or, justement, le recueil des caractères chinois de base comprend 13 051 idéogrammes ou signes différents. Il sera alors le vocabulaire idéal d'un ordinateur du chinois. Outre la capacité de traiter tous les caractères du recueil fondamental, les systèmes d'exploitation des ordinateurs du chinois, dans leur ensemble, doivent également pouvoir disposer au moins de deux procédures d'entrée pour satisfaire la demande de l'utilisateur. Cependant, à cause du grand nombre de signes ou caractères, l'ordinateur ne peut guère être parfaitement performant. Aussi tout progiciel incorporé devra aussi posséder une capacité qui permette à un utilisateur de frapper ou de créer tout seul les caractères dont il a besoin. Cet utilisateur pourra alors en fonction de chaque de mande personnelle fabriquer les caractères ou les signes que le système n'aura pas mémorisé.
Hao Chen-tai Grand clavier chinois (partie).
L'entrée du chinois
Comme les caractères chinois sont d'origine pictographique, tous les caractères, simples ou composés ultérieurement, ont une forme indépendante et unique et ne ressemblent en aucun cas aux mots écrits avec des signes phonétiques. En effet on peut écrire et sortir d'innombrables mots avec un nombre très restreint de lettres alphabétiques. C'est pourquoi, les procédures d'entrée du chinois ne ressemblent pas du tout à ceux des lettres alphabétiques. Avant 1979 à Taiwan, beaucoup de spécialistes se sont penchés sur les procédures d'entrée des caractères entiers. Mais cette procédure exige beaucoup de temps d'utilisation au moyen d'un immense clavier. En effet, dans cette procédure, l'utilisateur doit d'abord repérer l'emplacement du caractère sur ce grand clavier qui comprend des rangées de milliers de caractères pour pouvoir en frapper la touche et l'introduire dans l'ordinateur. Comme le nombre de caractères, nécessaires au traitement informatique en chinois, atteint plus de 13 000 signes, la surface d'un tel clavier est démesurée. Même avec l'idée d'une division pratique du clavier, les caractères sont alors répartis sur plusieurs plaques, selon leur fréquence et leur spécificité d'utilisation. Il n'empêche que la surface occupée demeure toujours trop grande, et la frappe des caractères fort peu commode. Ce type de grand clavier utilisable dans la procédure d'entrée ne saurait contenir dans un clavier alphabétique normal de l'ensemble des ordinateurs. De plus, la vitesse d'entrée étant plus lente, son extension est peu aisée. C'est pourquoi cette procédure d'entrée des caractères entiers n'est plus aujourd'hui utilisée, excepté dans un petit nombre d'entreprises.
Il a donc fallu analyser la structure des caractères chinois, en les décomposant en divers radicaux structuraux. C'est la procédure d'entrée que l'on rencontre plus couramment aujourd'hui. Selon les données statistiques de fréquence, ces radicaux ont été repartis sur les touches du clavier qwerty (angloaméricain) ou bien définis selon un code. C'est la procédure d'entrée des radicaux idéographiques. Chaque fois qu'il s'agit d'introduire des caractères chinois dans l'ordinateur, il suffit de frapper la touche correspondante des radicaux composant ledit caractère ou bien de taper leur code à la manière des lettres d'un mot alphabétique. Comme l'analyse des caractères par radicaux n'est pas uniforme, on a utilisé des formules de division différentes, d'où l'existence de plusieurs procédures d'entrée. Il faut que les radicaux soient tous bien distribués sur les touches du clavier qwerty normal. Se conformant à ces touches, il suffit alors d'utiliser un clavier normal pour introduire les caractères selon la procédure en place, ce qui est beaucoup plus commode que les procédures d'entrée sur grands claviers dont la plupart sont beaucoup trop larges pour être adoptés.
Hao Chen-tai Dactylos devant leur « immense» clavier.
A l'heure actuelle, le progiciel Tsang-jié (du nom de l'inventeur mythique de l'écriture chinoise) est certainement la principale procédure d'entrée par radicaux utilisée à Taïwan. Presque tous les logiciels du chinois ont adopté ce type de procédure. Dans le progiciel Tsang-jié, il n'est utilisé que 25 touches, de A à Y. Comme il repose sur un clavier normal, tous les matériels peuvent l'utiliser pour introduire le chinois. Par exemple, pour introduire les deux caractères ming-t'ien 明天 (demain) dans l'ordinateur selon ce programme, il faut décomposer les deux caractères comme suit. Le premier caractère ming se divise en radical je 日 sur la lettre A et en radical yué 月 sur la lettre B, tandis que le second caractère t'ien se divise à son tour en deux radicaux, yi 一 sur la lettre M et ta 大 sur la lettre K. Ainsi, après avoir accédé au progiciel Tsang-jié, la frappe des lettres A et B donne le caractère ming et celle des touches M et K donne le caractère t'ien. Ici les caractères sont simples et correspondent chacun à deux touches pour les introduire dans l'ordinateur et y former le terme ming-t'ien (demain) .
Bien sûr, les procédures d'entrée par radicaux ont toutes un code d'application pour pouvoir être opérables. Comme cette nouvelle définition de l'écriture est quelque peu éloignée de ce que les Chinois ont appris à l'école, il est nécessaire de suivre une courte formation pour pratiquer convenablement cette procédure d'entrée. Il se fait donc une sélection de l'utilisateur. Pour y pallier, il existe une autre procédure d'entrée par la prononciation des caractères. Chaque caractère est aussi fondamentalement défini non plus par sa forme mais par sa prononciation à l'aide des symboles phonétiques du kouo-yu (langue nationale chinoise) ou Tchou-yin. Ce système Tchou-yin qui comprend 37 signes représentant les consonnes et les voyelles simples ou combinées, plus 4 signes pour marquer les tons, a permis de fixer la prononciation de tous les caractères chinois. Or, tout le monde à Taïwan a appris ce système à l'école primaire et sait pratiquement l'employer. Aussi, a-t-on pensé l'utiliser dans les procédures d'entrée du chinois dans l'ordinateur. Sans formation particulière, l'utilisateur est immédiatement apte d'introduire tout caractère par les symboles Tchou-yin, ce qui est un point très important. Cependant, comme il existe de nombreux caractères homophones, un même son regroupera plusieurs caractères. Ainsi, après l'affichage de tous les caractères d'un même son et même ton sur le moniteur, il suffira dans un deuxième temps de frapper le caractère répertorié pour l'introduire dans l'ordinateur. Il est également facile de réduire la vitesse d'entrée, et la personne initiée sensible à la vitesse d'entrée pourra adopter un style de frappe approprié. Pour satisfaire les différentes demandes, la plupart des systèmes d'exploitation du chinois actuels possèdent à la fois les progiciels Tsang-jié et Tchou-yin. Avec le progrès technique des logiciels et le renforcement fonctionnel des matériels et périphériques, on a adopté une technologie industrieuse et ingénieuse en l'accordant aux principes phonétiques, linguistiques et autres, particuliers au vocabulaire chinois. Ainsi, la technique actuelle peut déjà à partir de plusieurs caractères homophones sélectionner le caractère désiré. Comme on peut en outre créer les quelques caractères homophones qui font défaut au progiciel Tchou-yin, on peut penser qu'à l'avenir la procédure d'entrée par la phonétique sera acceptée plus aisément par l'ensemble.
Exemples de style de caractères issus d'une imprimante d'ordinateur.
La sortie des caractères chinois
Après l'entrée dans l'ordinateur, le chinois qui s'affiche sur l'écran d'un ordinateur doit pouvoir se visualiser sur un autre support, et même s'imprimer. C'est un problème d'une plus grande complexité. Avant tout, il faut savoir que la forme de tout caractère chinois se trace dans un carré, en conséquence, quel que soit le nombre de traits qui le compose, la surface utilisée par tout caractère sera identique. Ainsi, le caractère yi 一 (un) de 1 seul trait et le caractère désuet t'a 龘 (marche du dragon) de 48 traits seront tracés sur l'écran dans un même espace. Pour cette raison, un ou plusieurs mêmes radicaux différemment arrangés dans des caractères différents peuvent varier en grandeur. Leur taille doit alors se conformer à la structure générale du caractère. Cela rend donc les radicaux chinois difficiles à tracer dans une méthode qui veut les rassembler. C'est pourquoi, les écrans d'ordinateur du chinois utilisent presque tous une matrice à points pour l'affichage des caractères. De plus, pendant des milliers d'années de la longue histoire de , un grand nombre de caractères ont été modifiés en des formes tout à fait différentes. Dans l'arrangement de textes ordinaires, pour leur conserver une esthétique et une originalité, notamment dans les tseu [辭], un terme, on a souvent mélangé les formes, les styles et les tailles des caractères. Cela a donc créé toutes sortes de caractères parmi lesquels les utilisateurs ont pu choisir. C'est une fonction que l'ordinateur du chinois a également besoin de disposer. Cependant, l'utilisation de la matrice à points pour afficher les formes et styles variés de caractères de toute taille et leur stockage dans l'ordinateur exige un dispositif de mémoire de grande consommation. Dans la technologie actuelle, ce n'est pas encore un moyen très économique. Avec la recherche active de ces dernières années à Tàiwan, il existe un immense marché de progiciels de création de caractères. Ces séries de programmes n'ont actuellement que de trois styles différents d'écriture capables de créer des formes les plus diverses. De plus, il y a eu un effet positif considérable sous la forte influence des systèmes japonais de haute qualité.
L'application informatique du chinois
Aujourd'hui, l'application informatique du chinois lancée à Taïwan qui s'est structurée et développée en fonction des systèmes d'exploitation du chinois s'est intéressée à l'entrée et la sortie du chinois puisque ces systèmes en font le traitement complet. Cette application n'a fourni à l'utilisateur qu'une fonction pratique dont la formule en chinois s'est développée. Elle embrasse les affaires de personnel, les salaires, la comptabilité, les stocks, les archives, et s'étend jusqu'au domaine informatique bancaire. On peut aujourd'hui utiliser le chinois un peu partout. On peut dire que l'ordinateur s'est étroitement intégré dans la vie. Il convient de souligner la découverte de la composition assistée par ordinateur qui a eu une si grande répercussion sur toute l'industrie de l'imprimerie de Taïwan. A partir de 1987, les journaux de Taïwan ont peu à peu abandonné les méthodes anciennes et traditionnelles de mise en page pour la composition informatisée. Cela a énormément réduit le temps de la rédaction et de la composition des journaux. Dernièrement, c'est certainement grâce à ces compositions assistées par ordinateur que tout s'est ébranlé, sans parler de la création de formes idéographiques dont on a parlé plus haut. La composition, selon le kien-tseu [檢字] traditionnel, le classé indexé des caractères, a donc peu à peu été remplacée par l'ordinateur.
Les difficultés rencontrées
En observant le développement des ordinateurs du chinois à Taïwan, c'était il y a dix ans encore une phase de recherche et d'étude. Pour le traitement du chinois par l'ordinateur, en particulier, et une informatisation du chinois, en général, il aura fallu un peu plus de cinq ans pour l'étude de la sortie du chinois. Depuis 1983, l'évolution de l'ordinateur en chinois à Tàiwan a entamé la deuxième période: l'informatisation du chinois proprement dite, avec le traitement de textes et documents chinois et la conversation par ordinateur en cette langue. Il s'agit d'un point important puisqu'on assiste justement à la « sinisation » des système d’exploitation.
Pour l'introduction du chinois dans l'ordinateur, dès le départ on a réellement rencontré d'énormes résistances, mais les spécialistes ont fait de rudes efforts pour développer différentes procédures d'entrée spécialisées de tout ordre afin de parvenir à une vitesse d'entrée de 90 caractères par minute. Quant à la résistance qui planait sur ce domaine s'est nettement affaiblie. Il y a toujours une assez grande incertitude dans le nombre des caractères chinois à utiliser. Bien que le « recueil national des caractères chinois » en contienne 13 051, le nombre des caractères nécessaires aux systèmes des bibliothèques et de la tenue de l'état civil dépasse de loin ces chiffres. Dans la tenue de l'état civil, ce problème est extrêmement important. En voici la raison : les Chinois croient fermement que la vie est le reflet de la connaissance. Beaucoup, dans le choix d'un nom, ont aimé créer un nouveau caractère. Et pour l'informatisation du chinois, chaque caractère est défini par un code pour s'afficher dans l'ordinateur, encore faut-il pouvoir y ajouter tous les nouveaux caractères. La conception des systèmes d'exploitation du chinois aura donc une influence considérable. Heureusement, grâce à l'élévation du niveau d'instruction, le taux de création de nouveaux caractères a beaucoup diminué, ce qui a rapidement permis aux conceptions des programmes de se stabiliser. Toutefois la phase pendant laquelle la technologie a pu s'épanouir a ren contré un nouveau problème: la normalisation. Avant le développement de l'ordinateur du chinois, par manque de normalisation, on a énormément dépensé de ressources humaines. En effet, l'informatisation un peu désordon née du chinois qui en a ralenti l'allure est justement en rapport étroit avec la normalisation.
Le développement futur
Parallèlement aux progrès de la fonction que l'ordinateur est appelé à prendre, de nombreux spécialistes se sont lancés dans la recherche de la reconnaissance du discours et celle des caractères chinois pour parvenir à un moyen plus naturel et un objectif lié à l'ordinateur. La technique dans le domaine linguistique, quoiqu'encore non parvenue à une phase productrice, a obtenu des résultats remarquables, comme ses expériences dans l'aide aux aveugles par l'utilisation de l'ordinateur. La technique dans le domaine de la distinction des formes imprimées de caractères est, elle, vraiment entrée dans une phase productive qui prévoit d'ici deux ans que cette sorte de reconnaissance informatique pourra servir dans les textes et documents chinois.
Depuis plus de dix ans, le développement des ordinateurs du chinois ont rencontré beaucoup de difficultés dont beaucoup ont été aujourd'hui surmontées, puis résolues. Maintenant, l'usage d'ordinateur du chinois à Taïwan est uni versel. Grâce à la dimension du marché de Tàiwan et au progrès technique du traitement de textes chinois, on peut utiliser avantageusement les normalisations internationales, tout en tenant compte de la demande de Taïwan. Pour encourager l'administration publique à tous les niveaux à se servir des ordinateurs du chinois, la coopération étroite entre le gouvernement, les centres de recherches, les secteurs industriel et commercial s'est fixée un horizon : la marche vers la normalisation. D'après son expérience passée, Taïwan devrait atteindre rapidement cet objectif puisque le développement de l'ordinateur du chinois est son espoir le plus cher. ■