Approche critique de l'outil « traitement de texte »

Dans l'article consacré au logiciel Lyx, publié dans le cinquième numéro de cette revue, l'auteur évoquait l'existence de différences profondes entre cet outil et d'autres traitements de texte. L'objet de cet article est d'entrouvrir - seulement - la porte de cette problématique, à partir de la question élémentaire mais fondamentale, de la nature du texte, en posant la question : qu'est-ce qu'un texte ?

Avant de préciser la nature et les objectifs de ce questionnement, on se contentera - dans un souci de simplification didactique - de ne considérer comme objet du propos que des documents dont la composante textuelle est principale et l'image, par conséquent, secondaire. Pour ce faire, sans nullement prétendre épuiser la question, on abordera ce problème au travers de deux perspectives : on peut considérer le texte comme un produit fini qui, dans sa forme classique, est imprimé sur une ou plusieurs feuilles de papier. Cette position conduit à adopter une perspective typographique. La seconde découle naturellement de l'aspect fini du produit textuel. Son existence est, en effet, conditionnée à une phase préalable permettant d'élaborer le texte en vue d'une impression ultérieure. Cette phase initiale s'inscrit donc dans une perspective éditoriale.

1 La perspective typographique

Lorsque l'on considère le texte comme un produit fini, imprimé sur le papier, on constate que le travail effectué par l'imprimeur au sens large (maquettiste, typographe...) aboutit à créer, sur une surface blanche, une ou plusieurs zones rectangulaires, colorées en noir d'intensité variable (selon la police, la graisse adoptée ...).

1.1 Notion de gris typographique

Ces zones imprimées contribuent à fonder la notion de gris typographique. Elles sont et peuvent être caractérisées géométriquement par leur position physique sur la page et la quantité de blanc qui sert de frontière entre les blocs. Elles instaurent une géographie de la page imprimée [Richaudeau]. D'une manière qui peut sembler quelque peu paradoxale au néophyte, c'est donc le blanc (et non l'écrit) qui instaure l'imprimé en texte. Cette formalisation permet alors de décrire la page, puis un ensemble de pages (du plus simple - prospectus, carte de visite, article, lettre... - au plus complexe - roman, encyclopédie, manuel... -), à partir d'un certain nombre de mesures de distance (marge haute, basse, indentation des paragraphes, police et attributs...).

On peut raffiner la description en accordant à chaque bloc une intensité de couleur (du blanc au noir). Cette intensité est liée à des caractéristiques physiques de la police utilisée (dessin des caractères, graisse...) et à l'interlignage (l'accroissement de l'espacement entre les lignes diminue l'impression d'intensité du noir).

Il faut remarquer que la notion de gris typographique est une notion visuelle, sensorielle, qui est perçue par le lecteur quasiment avant la lecture proprement dite : cette notion ne fait aucunement appel ni au contenu, ni au sens du texte. Elle permet cependant de caractériser, de manière fine, nombre d'imprimés : pour s'en convaincre, il suffit, en superposant une feuille de calque sur un imprimé, de tracer les limites des différents rectangles et de les colorier en gris plus ou moins intenses. Le dessin obtenu permet, dans un grand nombre de cas, de reconnaître le type d'écrit (journal, revue, livre...) et même d'avancer le titre de la publication (faites l'expérience avec deux magazines présentant les programmes télévisés).

Cette perspective descriptive de la géographique de la page imprimée est à la base d'un certain nombre d'outils logiciels de publication assistée (comme Publisher, Page Maker, Quark XPress...) qui exigent, de manière plus ou moins stricte, que l'utilisateur de l'outil définisse d'abord les différentes zones avant de pouvoir y incorporer du texte (ou de l'image). Cette perspective peut aussi servir de fondement pour l'analyse des outils plus classiques de traitement de texte : on n'utilisera, pour cela, que les deux exemples classiques d'outils de traitement de texte que sont Word (ou Word Perfect, Star Office sous Linux) et Latex.

1.2 Gris typographique et Wysiwyg

Lorsque l'on utilise un traitement de texte basé sur le concept du "What you see is what you get" 1, les caractéristiques géographiques des blocs de texte sont éparpillées dans les divers dispositifs de commande offerts à l'utilisateur (menus, barre d'outils) : dans le logiciel Word, une partie des commandes se trouve dans le menu Fichier, sous la rubrique Mise en page - marges, recto-verso - ; le reste des caractéristiques contribuant au gris typographique dépend fortement de la manière dont l'utilisateur se sert de l'outil. On peut, en effet, modifier nombre de celles-ci par l'intermédiaire des menus (Format, Paragraphe - espacement avant et après le paragraphe, justification, retrait, indentation - ou Caractères - police, corps, enrichissement -). Certains attributs du gris typographique peuvent aussi être manipulés par les boutons (gras, interlignage...) de manière quasi directe, interactive. L'interface graphique, sous le prétexte de la facilitation des manipulations de l'usager, contribue donc à faire éclater l'unité conceptuelle du gris typographique.

Dans le cas d'un écrit long (rapport, ouvrage, mémoire...), l'insertion de ruptures que constituent les sauts de page et de section augmente potentiellement l'éclatement du concept de gris typographique. De ce fait confirmé par l'expérience quotidienne du contact avec des utilisateurs, on peut poser que l'outil envisagé ne permet pas obligatoirement de créer un document prenant en compte la notion de gris typographique et les régularités qui en découlent. Cet éclatement conceptuel est aussi source potentielle de grandes difficultés de compréhension (et donc de manipulations) pour l'utilisateur final : devenir un utilisateur compétent suppose en effet de rassembler les bribes du concept éclatées dans l'interface et de reconstruire le concept de base et ses attributs.

L'utilisateur peut cependant se montrer plus soucieux de régularité et plus prévoyant, en utilisant des styles (de paragraphe ou de caractère), accessibles au travers du menu Format, Style, Définir ou Modifier. Après avoir été créés, ces styles qui ne sont que la définition de l'aspect d'un fragment de texte et d'une partie seulement de son gris typographique, sont accessibles par l'intermédiaire d'une liste déroulante, située à gauche dans la barre d'outils. Cependant, ces styles ne contiennent que des informations liées à la présentation de l'élément en question et donc à la notion de gris typographique. Ce dispositif ne fait que rassembler un certain nombre d'attributs qui sont appliqués aussitôt à l'élément considéré : ils ne contiennent pas (ou peu) d'information sémantique car il est, par exemple, possible et autorisé d'insérer un titre de section avant un titre de chapitre. Le concept de gris typographique est utilisé de manière procédurale. Enfin, la notion de modèle de document utilisée par le logiciel Word ne fait que rassembler certains styles ; elle peut être considérée comme relativement mineure dans la perspective étudiée.

De cette revue sommaire, on peut retenir qu'un traitement de texte, basé sur le paradigme du "what you see is what you get", produit un éclatement de la notion de gris typographique en proposant à l'utilisateur des ensembles de commandes situés à des niveaux différents et variés de l'interface. Cet éclatement conceptuel ne semble pas de nature à faciliter la tâche de l'utilisateur de l'outil traitement de texte. La question du gris typographique est instaurée en dehors de toute analyse du contenu du texte, de toute perspective éditoriale.

2 La perspective éditoriale

Cette question, en toute logique, devrait être posée prioritairement à celle de la finalisation du texte car il ne saurait y avoir impression avant établissement du texte, c'est-à-dire avant son écriture proprement dite : cependant, le paradigme du "what you see" 2 instaure de manière prioritaire la finalisation en privilégiant l'aspect visuel du texte par rapport à son contenu. Il serait, à ce sujet, intéressant d'examiner les divers outils dans cette perspective et de conclure que les outils de traitement de texte offrent bien plus d'accessoires permettant la finalisation que la production du texte. Il faut cependant reconnaître que les accessoires 3 utiles pendant la phase strictement élaborative sont nettement plus complexes à élaborer, voire insuffisants (cf. les divers dictionnaires, correcteurs orthographiques, syntaxiques...) que ceux permettant la mise en forme d'un texte élaboré.

Sans entrer dans le détail, fort complexe et toujours discuté au niveau scientifique, de la modélisation des opérations cognitives effectuées par un scripteur dans une tâche d'élaboration d'un texte écrit, on se contentera de considérer son résultat du point de vue de l'auteur. Dans cette perspective, le texte peut être caractérisé par une certaine structure logique : ici l'introduction, là un titre, là un paragraphe... On peut rendre compte de cette structure en utilisant une grammaire formelle, laquelle conduit à la hiérarchisation des éléments textuels : un paragraphe est élément d'une section, une section élément d'un chapitre... Certains logiciels permettant la visualisation de textes (par exemple, Acrobat Reader de la société Adobe) utilisent de manière explicite la structure du texte pour permettre son parcours. De ce fait, le texte, dans la perspective éditoriale, n'est plus une simple suite de rectangles colorés, mais se montre proche d'une base hiérarchique de données.

Cependant, il ne faudrait pas croire que les deux structures définies (gris typographique et base hiérarchique de données textuelles) s'opposent et entrent en conflit : tout le travail du typographe consiste à caractériser visuellement chacun des types d'éléments définis dans la base, dans un souci de respect du texte originel de l'auteur. Ainsi, si vous reprenez le calque élaboré précédemment, vous pourrez vous rendre compte de la correspondance entre les deux aspects visuel et logique de la modélisation d'un même texte. On doit d'ailleurs noter que toute irrégularité dans la correspondance est source de difficultés pour le lecteur du texte (ce qui constitue la principale difficulté de l'utilisation des outils de PAO 4 malgré l'apparente facilité de leur manipulation). À cause de la correspondance - l'isomorphisme - entre le marquage logique et le marquage typographique, une nouvelle possibilité est mise au jour : la possibilité d'associer automatiquement à chaque élément structurel, par un marquage déclaratif, un certain aspect visuel.

Contrairement à la prédominance de l'aspect visuel du texte établie par la perspective typographique, la perspective éditoriale met en avant l'aspect logique du texte et de l'organisation du discours. Le travail second (temporellement) du typographe consiste à établir un isomorphisme entre deux structures. Cet isomorphisme, permettant par définition d'établir une correspondance terme à terme entre les éléments des deux structures, est à la source d'une nouvelle conception de l'outil qu'est le traitement de texte.

3 Nouvelle conception du traitement de texte

En fondant conceptuellement le traitement de texte à partir de la structure logique du texte à produire, on met à la première place la description de cette structure et en second, la structure visuelle. Ce déplacement de la priorité des éléments entraîne des changements importants, même au niveau de l'interface : les attributs typographiques et visuels sont attachés à des éléments logiques appartenant à une certaine classe de documents. Ils n'en sont donc qu'une conséquence : à chaque élément logique décrit (titre de niveau n, paragraphe, citation...) sont attachées des caractéristiques typographiques (police utilisée, taille, graisse, espace avant et après...). C'est ce qui caractérise la différence entre Latex et les traitements de texte cités précédemment (Word, Star Office...).

Latex ne permet pas l'édition du texte, il est - strictement parlant - un outil de traitement de texte et non une trousse à outils plus ou moins complète (éditeur, traitement, finalisation...). Latex n'est qu'un outil permettant de remplacer automatiquement des commandes du niveau de la logique éditoriale par des commandes du niveau de la logique typographique, les seules interventions de l'utilisateur se traduisant lors de la confection de classes 5 de document, incluses dans des "packages" 6. Cette possibilité confère à l'outil une extensibilité quasi illimitée, encore accrue par la disponibilité du code source du logiciel. Par conséquent, le traitement n'a aucune raison d'être interactif. Il ne fait que s'inscrire dans un modèle en couches du traitement du texte du document : la tâche d'élaboration, de rédaction s'effectue lors de l'édition. Au moyen de balises textuelles, l'auteur effectue la description logique de la structure du texte.

Un outil spécifique transforme ces balises en marques d'enrichissement typographique (toujours sous une forme textuelle). Ces marques sont traduites, indépendamment du périphérique de sortie (DVI), par un logiciel spécifique Tex, considérant que chaque élément (de la lettre aux entités supérieures) occupe un rectangle sur la page ou dans le document. Ce positionnement physique est affecté d'une certaine élasticité (la conception de glue de Donald Knuth), afin de permettre des ajustements locaux fins. Finalement, un dernier dispositif logiciel se charge du rendu du document en fonction d'un périphérique donné.

L'objectif essentiel de Lyx dans cette entreprise est d'offrir une interface graphique permettant l'intégration de différents outils dans une sorte de "caisse à outils" dédiée au traitement de texte.

Selon le niveau de rigueur attaché à la priorité, la description du modèle de texte peut être préalable ou concomitante : la norme SGML exige la description complète et stricte (au travers d'un processus de vérification) d'un modèle abstrait (logique) du document, une DTD 7, ce qui peut sembler une démarche difficile - car trop rigoureuse - aux utilisateurs finaux. Le traitement de texte Lyx adopte une démarche moins stricte en se posant comme un intermédiaire entre la position procédurale et la position alogique. Il utilise en effet les éléments définis par Latex - sans toutefois être complètement transparent à son égard - pour faciliter une manipulation de type "whysiwyg". Il ne peut donc échapper entièrement aux problèmes qui s'attachent à une telle conception de ce type d'outil.

On ne saurait terminer sans évoquer les outils créés par l'équipe de Vincent Quine de l'INRIA (Alpes) à partir de Thot, qui est un éditeur déclaratif offrant la particularité de permettre d'intervenir et de visualiser le document en cours d'élaboration selon différentes perspectives synchronisées : structure hiérarchique sous la forme d'une arborescence, document tel qu'il sera vu par l'utilisateur. La modularité adoptée lors de la conception (un langage de description structurelle, un langage de description typographique...) a permis de réaliser des extensions du produit de base (comme le travail coopératif, en permettant l'édition d'un même document par plusieurs auteurs). Le lecteur intéressé par de telles perspectives consultera le site du projet Opera (inrialpes.fr) et y trouvera, en plus des produits opérationnels sous Linux, une importante bibliographie en ligne.

 

Lionel Conraux

Équipe Théodile, EA 1763

UFR des Sciences de l'Education

Université de Lille III - Villeneuve d'Ascq

 


© Copyright 2000 Diamond Editions/Linux magazine France. - Permission is granted to copy, distribute and/or modify this document under the terms of the GNU Free Documentation License, Version 1.1or any later version published by the Free Software Foundation; A copy of the license is included in the section entitled "GNU Free Documentation License".