Écriture WYSIWYM : "What you see is what you mean"

Dès lors que son écriture procède du computationnelle, l'auteur doit avoir conscience qu'il programme afin d'en garder le contrôle. En cela le principe du WYSIWYG ne peut pas s'appliquer à l'écriture computationnelle, puisque ce dernier vise précisément à masquer la dimension calculatoire du numérique pour simuler un ordre graphique. D'un autre côté le recours à un langage de programmation de bas niveau n'est pas non plus souhaitable, car il relève d'une pratique d'informaticien, qui requiert des compétences spécifiques (concepts, méthodes, langages...) et qui interfère avec la pratique d'auteur.

Le WYSIWYM a été pensé pour permettre un compromis entre la posture essentiellement sémiotique du WYSIWYG et celle essentiellement logique de la programmation informatique.

Principe du WYSIWYM

Le WYSIWYM consiste à associer aux contenus que l'on écrit des descripteurs qui les caractérisent pour paramétrer ce qu'un ensemble de programmes doit faire de ces contenus lors de leur restitution pour la lecture.

Toute écriture numérique procède d'un codage (inscription de l'information à transmettre sous la forme de chiffres binaires) et toute lecture d'un décodage (transformation des chiffres binaires enregistrés en signes interprétables). Dans le cadre du WYSIWYM l'idée est que ce codage ne se fait pas sur une dimension exclusivement sémiotique (comme pour le WYSIWYG), mais également sur une dimension calculatoire. Ce qui est codé, c'est à la fois du signe et du calcul. L'enjeu est de permettre au programme de lecture une plus grande variabilité dans la restitution du contenu pour mieux remplir des fonctions computationnelles comme le polymorphisme, le paramétrage ou l'interactivité.

Exemple WYSIWYG et WYSIWYM

Des symboles pour les hommes et pour les machines

Les descripteurs associés au contenu sont donc des symboles qui sont interprétés par l'auteur qui écrit pour exprimer une information relative au contenu qu'il écrit, pour préciser ce qu'il veut dire. Ce sont également des symboles reconnus par les logiciels de lecture ou de publication. Ces logiciels vont donc adapter la présentation du contenu sur le support de lecture afin de restituer un environnement sémiotique fonction du contenu et de sa description.

Les descripteurs concernent toutes les formes sémiotiques (textes, images...) et peuvent revêtir également plusieurs formes : textuelle, graphique, iconique... Un éditeur WYSIWYM est donc aussi un éditeur graphique, mais la forme qu'il adopte n'est pas contrainte par le respect de la forme finale qui sera publiée, et elle cherchera plutôt à optimiser l'acte d'écriture.

« Ainsi, avoir un éditeur qui met en forme en gras un texte qui a été déclaré comme "important" est simplement destiné à exploiter nos habitudes de présentation pour "faire sens" plus vite dans notre esprit : lire une balise <important> encadrant le texte est naturellement plus laborieux et surtout ne fait pas appel à nos "réflexes". De même pour la notion de paragraphe, de listes à puces, etc. Pourquoi ne pas exploiter la force de ces réflexes acquis ? Après, dans une publication donnée, que la puce de la liste soit un rond noir ou un carré rouge pour mieux se fondre dans une charte graphique, quelle importance pour l'auteur ? Le sens est là ! (Spinelli, 2006) »

Une petite histoire du WYSIWYM

En 1999, alors que nous commençons à travailler sur ce qui deviendra Scenari, écrire sur un ordinateur, c'est écrire avec Word, Notre Word, comme d'autres auraient dit "Notre Ford". Tout le monde a appris à taper sur un clavier avec Word. Word est sur toutes les machines. Le Wordisme est une religion, vouloir faire autre chose est une hérésie. Nous sommes alors dans le meilleur des mondes, pourquoi en changer ?

« Our Ford himself did a great deal to shift the emphasis from truth and beauty to comfort and happiness [fr[1]] (Huxley, 1932) »

Pour sacrifier un peu au confort donc, peut-être, aux habitudes certainement, pour rechercher de la « vérité » du numérique, de son potentiel computationnel, et même, finalement, retrouver une « beauté » perdue dans ces traitements de texte et éditeurs WYSIWYG qui modèlent encore tant de nos textes.

Le Wordisme et Scenari

Le terme WYSIWYM a été retrouvé par Sylvain Spinelli en 2006. Nous cherchions - quotidiennement à l'époque, un peu moins souvent maintenant - à expliquer les choix ergonomiques faits pour l'interface et la logique d'édition dans Scenari. Celle-ci se démarquait fortement de la logique dominante, pour ne pas dire exclusive, du WYSIWYG, pour ne pas dire de Word.

Une préoccupation récurrente de nombreux nouveaux et futurs utilisateurs de chaînes éditoriales Scenari était de chercher comment concilier les avantages de celui-ci - polymorphisme, réutilisation, contrôle de la rédaction et de la publication -avec leur Word - c'est à dire une visualisation ancrée dans l'impression, un fichier monolithique, et une liberté totale d'écriture et de mise en forme. L'enjeu était de mettre en évidence la contradiction de ce discours. Le WYSIWYM ne peut se fonder que sur une déconstruction du WYSIWYG, c'est à dire une démonstration de l'opposition entre son principe technique et ergonomique d'ordre graphique et la recherche de certaines fonctions d'ordre computationnel. Pour exister, le WYSIWYM doit d'abord tuer Word.

Le traitement de texte et l'écriture sur le Web au milieu des années 2000

OpenOffice commençait à peine à se faire une place (marqué en France par une adoption à l'assemblée nationale, l'armée, la gendarmerie en 2006 et 2007), Google Docs naissait tout juste (2006). L'édition Web était arrivée au début des années 2000 via les CMS (Drupal et SPIP en 2001, Wordpress en 2003, Joomla! en 2005) et puis les Wikis. Mais les pratiques étaient loin d'être ce qu'elles sont aujourd'hui. Les contributions Wikipédia par exemple se développent réellement entre 2005 et 2007. C'est aussi à cette période qu'émerge l'expression Web 2.0 et que commencent à se développer les pratiques de commentaires en ligne.

Nombre de contributeurs Wikipédia considérés comme actifs par la Wikimedia Foundation
Explosion des contributeurs Wikipédia entre 2005 et 2007 (http://en.wikipedia.org/wiki/Wikipedia)

Naissance du terme WYSIWYM : de l'ingénierie des connaissances à l'ingénierie documentaire

La première formulation du terme WYSIWYM remonte à un article de Power, Scott et Evans (1998). Le terme est utilisé alors pour What You See Is What You Meant, dans un domaine assez différent. Les auteurs cherchent en effet une solution pour éditer des bases de connaissance exprimées sous la forme de réseaux conceptuels, et ils explorent pour cela des représentations sous des formes documentaires interactives manipulables par les utilisateurs de type expert métier, sans compétence en programmation ou en représentation des connaissances.

Leur objectif est donc de faire réaliser des programmes (des bases de connaissances) par des non informaticiens (des spécialistes métiers). Pour cela ils proposent à ces utilisateurs un texte interactif (feedback text) dont la manipulation (ajout/suppression de phrases) modifie le programme (ajout/suppression de connaissances) qui modifie à son tour le texte. Le WYSIWYM naît donc à l'origine d'une mobilisation de l'écriture pour la programmation, alors que le WYSIWYM dont nous parlons consiste au contraire à réintroduire de la programmation pour de l'écriture. Mais dans les deux cas il s'agit bien de mobiliser la dimension computationnelle en articulation avec la dimension graphique. Et de fait les auteurs sont amenés à explorer les mêmes questions que nous.

Ils proposent notamment une caractérisation des traitements de texte WYSIWYG. Ces éditeurs permettent d'intervenir directement au niveau des caractères (graphémique), indirectement au niveau graphique (on peut changer la présentation des caractères, mais pas dessiner librement sur la page) et pas du tout au niveau sémantique (qui n'est qu'interprétable par l'homme à partir des deux niveaux précédents). Le WYSIWYM est alors défini comme le moyen pour les utilisateurs d'intervenir directement sur la couche sémantique, par la formalisation de connaissances.

Outre cette hypothèse fondatrice, on retrouve des principes structurants comme :

  • la génération de textes et de mises en formes à partir de formalisations informatiques et la production de formalisations à partir de manipulations graphiques ;

  • le contrôle via des ancres d'interaction (l'utilisateur n'intervient plus au niveau du caractère comme dans un traitement de texte WYSIWYG, mais à certains points définis au sein de la structure) ;

  • la modélisation (les outils sont d'emblée spécialisés pour un contexte métier, des procédures multilingues dans le cas présenté par les auteurs).

Ces travaux déboucheront sur l'application du WYSIWYM pour l'édition de document multimédia (Van Deemter and Power, 2000). L'idée est d'associer à la base représentant le contenu, une seconde base définissant sa forme et sa présentation. Le dernier pas est ainsi franchi pour passer de l'ingénierie des connaissances à l'ingénierie documentaire. Le premier usage du terme en ingénierie documentaire, accompagné de la suppression du t de Meant, est associé à l'éditeur LyX (Morère, 2001). LyX est un éditeur LaTeX qui s'inscrit dans le courant de l'écriture structurée (André et al., 1989). Il veut se démarquer de « la tradition périmée héritée de la machine à écrire (Morère, 2001) ». La rupture principale apportée est la (re)séparation des tâches d'écriture et d'édition, qu'avaient fusionnées les traitements de texte WYSIWYG. Dès lors « le travail de typographie sera pris en charge en majorité par l'ordinateur, non par l'auteur (Ibid.) ».

Développement des éditeurs WYSIWYM : l'écriture structurée

Le principe du WYSIWYM - associer explicitement des marqueurs aux contenus dans l'intention de programmer leur publication - remonte en fait aux origines des traitements de texte. En effet, avant le développement des interfaces graphiques dans les années 1980, les terminaux textuels ne permettaient par de mettre en forme dynamiquement le texte à l'écran ; la solution consistait alors à associer des caractères particuliers au texte pour programmer un rendu particulier lors de l'impression, par exemple, mettre une chaîne en gras ou en italique.

Fonction italique sous WordStar

^YCeci est un texte en italique^Y

L'écriture structurée - ou édition structurée - est une approche à la fois technique et méthodologique de l'écriture numérique dont on peut faire remonter l'origine aux technologies LaTeX (créé en 1982 sur la base du langage d'édition TeX, lui-même créé en 1978) et SGML (norme ISO depuis 1986, issue des travaux d'IBM initiés en 1979 avec GML). Tandis que le mouvement WYSIWYG cherche à dissoudre la structure du texte dans sa représentation graphique, l'écriture structurée cherche au contraire à conserver le principe du marquage explicite du contenu, grâce à un système de balisage qui serait à la fois intelligible par l'homme et par la machine.

Exemple de structure LaTeX (à gauche) et SGML (à droite)

\begin{document}

\section{L'édition structurée}

Le principe du WYSIWYM...

\end{document}

<document>

<section>L'édition structurée

<paragraph>Le principe du WYSIWYM...

</document>

La nouveauté introduite par l'écriture structurée est que les balises ne cherchent plus à programmer directement une mise en forme (gras, italique), mais à expliciter la structure du texte (titre, résumé, paragraphe, mots importants...) : ainsi l'auteur mobilise les balises pour formaliser l'organisation de son texte, et cette formalisation est ensuite exploitée par un algorithme pour réaliser des mises en forme. Cette forme d'écriture écarte donc le graphique pour s'inscrire plutôt dans une forme de programmation ; et elle est bien reçue comme telle par les auteurs, qui, dans l'ensemble, la rejette également. L'écriture structurée reste alors une pratique circonscrite à des niches professionnelles au sein desquelles les avantages de l'écriture structurée - le contrôle typiquement - est déterminant : LaTeX pour l'édition scientifique, SGML pour la documentation technique. Dans tous les cas l'écriture structurée reste à ce stade une pratique d'experts formés spécifiquement pour (rédacteurs techniques), ou de "logiciens" dont les modes de raisonnement et d'écriture sont compatibles a priori (informaticiens, mathématiciens...).

Nous pouvons alors redéfinir le WYSIWYM comme le mouvement qui a conduit à réconcilier les pratiques d'écriture structurée avec les pratiques d'écriture ordinaire. Côté SGML, une des premières initiatives est l'éditeur Grif (Quint, 1987), côté LaTeX, LyX (Morère, 2001). Dans tous les cas, l'approche consiste à réintroduire du graphique au dessus du programmatique lorsque c'était possible. Et par ailleurs, les notions de modélisation et de spécialisation s'affirment lorsque les systèmes se frottent à la complexité consistant à rendre le plus accessible possible la couche de formalisation, pour des auteurs et non des programmeurs.

« Tout cela rend improbable la définition d'un modèle unique pouvant décrire n'importe quel document à un niveau d'abstraction relativement élevé. On pourrait évidemment tenter de dresser une liste d'entités d'usage général, comme les chapitres, sections paragraphes, titres, etc... et ramener les entités exclues de cette liste à celles qui y figurent. Ainsi une introduction pourrait être assimilée à un chapitre, une clause de contrat à un paragraphe ou une section. Mais en voulant élargir le domaine d'utilisation de certaines entités privilégiées, on risque de les vider de leur sens et donc de réduire la puissance du modèle. (Quint, 1987, p95) »

« Il paraît impossible de dresser un inventaire exhaustif de toutes les entités nécessaires et suffisantes pour décrire n'importe quel document. Il semble tout aussi impossible de décrire une fois pour toutes l'organisation de ces entités dans un document. C'est pourquoi, l'approche que nous avons prise s'écarte de celle utilisée dans certains systèmes de traitement de documents structurés [...] où les entités et leur organisation sont spécifiées de façon définitive. Nous proposons plutôt un méta-modèle qui permet de décrire de nombreux modèles, chaque modèle ayant une utilisation limitée à une classe de document. (Ibid.) »

C'est dans cette filiation que s'inscrit Scenari, en profitant des avancées apportées par les technologies XML à partir de 1998.

Le WYSIWYM : un compromis entre graphique et logique, en contexte

Le WYSYWIM est historiquement la recherche d'un compromis entre manipulation graphique et programmation, en fonction du contexte d'usage visé. Selon les fonctions computationnelles visées et la typologie des acteurs impliqués dans le projet d'écriture, le curseur entre logique et graphique sera renégocié. Mais l'hypothèse du WYSIWYG doit être abjurée : tout n'est pas soluble dans le graphique, il faudra programmer, un peu.

Dualité sémiotique-logique du WYSYWIM

Un éditeur WYSWYM peut être vu comme un environnement de programmation de très haut niveau (au sens informatique), c'est à dire où l'on manipule des structures logiques proches du monde sensible, ici proche des manifestations sémiotiques recherchées, où l'on favorise l'interprétation par l'humain sur le calcul par la machine. Et un éditeur WYSIWYM peut également être vu comme un outil d'écriture traditionnelle augmenté de fonctions de programmation explicite. Il reste essentiellement sémiotique tant cela est possible, il repose sur une logique de programmation déclarative de haut niveau de préférence à une logique de programmation algorithmique.

Ainsi les balises qui supportent la structuration du texte dans un éditeur WYSIWYM ont une valeur sémiotique, elles sont des méta-données (des informations sur le texte lui même), et elles sont d'ailleurs généralement restituées graphiquement à la publication (les mots importants seront mis en forme en italique ou en gras, les définitions seront préfixées d'une étiquette, d'une couleur ou d'une icône). Mais les balises ont également une valeur logique, elles sont des paramètres de programmation, des instructions.

Le WYSIWYG est (presque) mort, vive le WYSIWYM

Le WYSIWYG a constitué une étape fondamentale pour l'adoption de l'ordinateur comme outil d'écriture, en faisant la jonction entre le monde du graphique et le monde du computationnel. Mais il a aussi contribué à paupériser les pratiques éditoriales : d'une part en transférant les métiers de l'édition sur les auteurs, appauvrissant la qualité graphique des textes ; et d'autre part en prétendant adresser de façon uniforme la totalité des pratiques d'écriture, de la lettre personnelle mono-page aux documents professionnels de plusieurs milliers de pages. Il butte aujourd'hui sur de nombreux obstacles qui relèvent du computationnel : pluralité des supports, interactivité, accessibilité...

L'enjeu est aujourd'hui de dépasser cette étape, et le WYSIWYM constitue un candidat sérieux à la passation de pouvoir.

WYSIWYM et fonctions du numérique

Cette partie s'appuie essentiellement sur un article de Spinelli (2006) publié sur le wiki de Scenari afin d'expliquer les enjeux du WYSIWYM aux utilisateurs des chaînes éditoriales XML. J'ai croisé ses considérations avec les fonctions auxquelles elles renvoient.

Polymorphisme

Un premier apport du WYSIWYM est le polymorphisme. En ayant dégagé l'écriture du contenu de sa forme de restitution finale, il devient possible d'écrire pour plusieurs supports de publication à la fois.

« En WYSIWYG, on écrit pour un et un seul support majeur (une et une seule mise en forme papier ou un et un seul site web), les autres sont considérés comme secondaires et dégradés. Par exemple, lorsqu'un support papier et un support Web trouvent tous deux un usage "important", le WYSIWYG est logiquement impossible. (Ibid.) »

C'est parce que toute écriture s'ancre dans une forme que le WYSIWYG et le polymorphisme sont antinomiques. Si l'auteur a la promesse d'une inscription graphique fidèlement restituée, alors la promesse doit être tenue, la forme ne peut pas varier. En revanche, si les formes de lecture sont explicitement abstraites dans une forme d'écriture qui les représente, en quelque sorte, il devient tenable d'écrire dans une forme (auctoriale) pour d'autres formes (lectoriales).

Interactivité

L'écriture de contenus interactifs, implique une programmation de cette interactivité qui, fondamentalement, ne relève plus du graphique. Si la représentation graphique de programmes est dans une certaine mesure possible, elle ne relève en tous cas plus du WYSIWYG, puisque l'interaction ne peut être seulement vue, elle doit être exécutée.

« Le WYSIWYG ne permet pas la production de contenu dynamique et interactif. Comment éditer un contenu riche qui apparaît dans un "tooltip" ? Comment écrire un contenu de type "web-radio" c'est à dire dont l'apparition/disparition est pilotée par une ligne de temps ? Comment écrire un exercice interactif en précisant la ou les bonnes solutions, le mode du calcul de scoring, les différents feed-backs possibles en fonction des réponses de l'apprenant ? (Ibid.) »

Le WYSIWYM permet donc de sortir du graphique pour intégrer la dimension computationnelle de l'interaction. Le WYSIWYG ne peut que proposer des formes simplistes d’interaction (si simple qu'elles se fondent dans leur forme graphique), et souvent nécessite une technicité importante pour forcer un logiciel qui n'est pas conçu a priori pour intégrer de l'interaction. On pourra citer par exemple les exercices interactifs de primaire "Les exOOOs d'Aleccor" (Cloarec, 2015), réalisés avec le traitement de texte OpenOffice Writer (exercices par ailleurs excellents en tant que contenu).

Paramétrage

Le paramétrage implique par définition que le contenu affiché dans le logiciel n'est pas ce qui sera vu par le lecteur, puisque cette visualisation dépend justement de paramètres.

« En WYSIWYG, on écrit un seul contenu monolithique où tout est "vu" : cela ne permet pas d'écrire un contenu plus riche qui est ensuite filtré en fonction du contexte d'usage et du support désiré (exemple : contenu en slideshow présentiel, support apprenant, consignes tuteurs). Impossible donc de faire un contenu à profondeur variable (Ibid.) »

Les descripteurs du WYSIWYM sont par construction des paramètres. S'ils ont souvent une fonction graphique, ils peuvent également être interprétés par le programme de lecture pour gérer par exemple un affichage sélectif en fonction de l'usage visé. Le contenu ci-après peut ainsi être interprété comme une instruction de mise en forme (mettre en valeur la question et la solution) ou comme une instruction de paramétrage (afficher les questions, mais pas les solutions).

<exercice>

<question>Décrivez en français ce que représente ce diagramme.</question>

<solution>Pour chaque moteur on relève tous les défauts observés à des dates différentes. Pour chacun de ces défauts on note le kilométrage et on diagnostique la gravité.</solution>

</exercice>

Métadonnées

L'universalité du numérique permet la fusion du contenu avec ses métadonnées, que ce soit pour enrichir l'édition (identification, datation, géolocalisation...) ou faciliter la gestion (licences, mots-clés...).

« Sans aller jusqu'à du contenu à profondeur variable, il est très souvent nécessaire d'ajouter des informations non publiées : quelques metadonnées, des commentaires pour l'orateur/tuteur, etc. Sur le plan ergonomique, il est très difficile de faire un éditeur WYSIWYG qui permette ce genre de choses. Des solutions ont néanmoins été trouvées par les éditeurs, au coup par coup : fenêtres de propriétés, bulles de commentaires superposées, etc. Ces solutions sont très limitées et surtout dédiées à des usages prédéfinis car très difficile à rendre ergonomiquement acceptable (Ibid.). »

Un exemple caractéristique est celui de la gestion des légendes des tableaux ou images dans les traitements de texte. En général la légende peut être saisie dans une sur-fenêtre dédiée. Mais parce qu'elle doit être affichée en WYSIWYG, elle est ensuite matérialisée par un flux de caractères sous la ressource considérée, associée avec un libellé et une numérotation. Et ce flux de texte doit alors être modifiable graphiquement, directement, sans passer à nouveau par la fenêtre. Cela engendre rapidement des erreurs ou une complexité importante, alors que la fonction à rendre est triviale dès lors que l'on accepte que cette légende n'est pas dans le flux de texte principal (visible et modifiable) lors de l'écriture, ce qui ne l'empêchera pas de l'être à la publication. L'acceptation de cette désynchronisation est à la base du WYSIWYM.

Contrôle

Les logiciels WYSIWYG ont cherché à reproduire la liberté dont dispose un auteur avec une page blanche et un stylo ou une machine à écrire tout en la combinant avec la puissance dont dispose un éditeur avec du matériel d'imprimerie. Cette hypothèse fondatrice pose deux problèmes. Elle suppose que l'auteur a les compétences de l'éditeur dans la manipulation des outils de composition graphique, ce qui n'est pas le cas en général. Ensuite, elle suppose que l'auteur est libre dans le format de son écriture. Or, dans de nombreux écrits, comme les écrits professionnels, que l'on pourra appeler utilitaires (par opposition aux documents personnels ou artistiques), ce n'est pas la liberté ou la compétence graphique de l'auteur qui est recherchée, mais plutôt une standardisation et une optimisation des productions permettant d'en contrôler l'écriture, la lecture, la gestion. Or le numérique permet d’inscrire et d'automatiser cette logique de contrôle au sein même du processus d'écriture.

« L'approche WYSIWYG [...] met donc en avant la forme et pas la structuration du contenu. De ce fait, il est encore moins acceptable pour l'auteur que l'outil le contraigne ou le guide dans une démarche d'écriture[...]. En d'autres termes, l'édition WYSIWYG est étrangère aux concepts de structuration documentaire, modélisation, ligne éditoriale. (Ibid.) »

Si de nombreux logiciels de gestion électronique de documents implémentent une surcouche de gestion au dessus de logiciels WYSIWYG classiques, cela conduit à des difficultés en terme technique (contraindre a posteriori ce qui est libre a priori n'est pas simple) et en terme d'acceptation (comment accepter le contrôle alors que le champ du possible reste ouvert). De fait, ces outils se développent surtout que dans des contextes à la fois suffisamment réglementés pour contraindre les pratiques et suffisamment prospères pour supporter des coûts de développement informatique importants (pharmaceutique, aéronautique...).

Les alternatives WYSIWYM permettent au contraire d'imbriquer d'emblée la couche de contrôle et de gestion et la couche d'écriture, chaque fois que l'un interagit avec l'autre.

Transclusion

La transclusion est la possibilité pour un premier document informatique de référencer un second document (ou fragment de document) de façon à l'afficher comme s'il était inclus dans le premier. C'est ce qui se passe par exemple quand une page Web affiche une image ou une vidéo  : la page référence l'image, qui peut être sur un autre serveur, et celle-ci est affichée à l'intérieur, comme si elle en faisait partie. Le premier bénéfice de la transclusion et de pouvoir réutiliser des ressources sans les recopier. Ces fonctions sont marginalement disponibles dans les outils bureautiques, pour permettre la gestion déportée des images par exemple, mais leur usage est à la fois complexe et peu fiable, ce qui fait que le copier/coller des parties réutilisées est la pratique dominante. Ce qui est copié est bien ici, je peux le voir et le manipuler comme ce que j'écris. Une fois encore le WYSIWYG fonctionne à condition de rapporter toutes les manipulations à la logique de l'écriture traditionnelle, de dissoudre le computationnel dans le graphique. Mais cette dissolution n'est pas sans perte.

« Avez-vous déjà essayé de créer une base de plusieurs documents Word et de les recombiner entre eux par des inclusions dynamiques ? Tous ceux qui s'y sont vraiment frottés vous diront que c'est une galère infernale ! En effet, vous ne pouvez pas vouloir à la fois maîtriser votre publication (gestion des hauteurs, des sauts de ligne et page pour du papier, gestion de la taille écran pour du web) et bénéficier du principe d'un contenu modifié à un seul endroit qui se répercute à tous les endroits où il est exploité. (Ibid.) »

Et aussi : multimédia, scénarisation, accessibilité, instantanéité, glose...

Ces réflexions permettent d'établir une première liste des principaux points de tension entre WYSIWYG et écriture computationnelle, qui sont levés par le WYSIWYM. Cette liste n'est pas exhaustive, on pourrait également citer :

  • le multimédia : l'intégration de contenus temporels ou de combinaisons de formes sémiotiques qui ne sont pas toujours présentes ensemble en même temps pose des problèmes de représentation spatiale ;

  • la scénarisation : l'écriture de contenus suivant des parcours non linéaires (réseaux de grains pédagogiques, récit suivant plusieurs arbres possibles) s'inscrit et se lit mal, par définition, dans la linéarité de la page ;

  • l'accessibilité : la gestion du handicap implique de considérer des éléments de formatage du contenu qui dépassent ce que l'on voit, pour se projeter dans ce que percevra un utilisateur via un dispositif de lecture adapté ;

  • l'instantanéité : l'écriture collaborative synchrone fait apparaître des marqueurs (couleurs) qui permettent de différencier les contributions lors de l'écriture, mais ne sont pas publiées ;

  • la glose : le contenu n'est pas plus la production d'un auteur unique, mais un amalgame de texte et de paratexte, dont l'agencement et la présentation ne relève plus du seul logiciel d'écriture ;

  • ...

Finalement la plupart des fonctions du numérique, en tant qu'avatars du computationnel, font émerger des situations où le graphique du WYSIWYG montre ses limites, et où se construisent les dispositifs d'écriture WYSIWYM.

Limites et extensions du WYSWYM

Écriture "zéro computationnel"

George R. R. Martin, l'auteur de A Game Of Thrones (Le trône de fer) a expliqué dans une interview utiliser un ordinateur déconnecté sous DOS pour écrire sous WordStar 4.0, parce qu'il voulait un traitement de texte, qui ne fasse "rien d'autre", qui ne lui fournisse aucune assistance, aucune distraction, aucune interférence avec son écriture (Holly, 2014).

Sylvain Spinelli écrivait en 2006 que le WYSIWYM relevait d'une « démarche inhabituelle [qui] nécessite un travail d'abstraction de la part de l'auteur qui en fonction des situations peut-être contre-productive, car inutile compte-tenu du type d'information à produire (simple, linéaire et statique) et de son exploitation (un seul support associé) ». L'ancrage de la dimension computationnelle dans la pratique de l'auteur exige de fait un effort supplémentaire, puisqu'il s'agit d'écrire tout en programmant. Or il existe des situations, comme celle de l'auteur de roman, qui ne cherchant pas à bénéficier de la dimension calculatoire, ne souhaitent pas en payer le prix. On remarquera que cette exigence conduit George R. R. Martin à rejeter les outils WYSIWYG modernes, déjà trop habités de calculs pouvant interférer avec son écriture. En alternative à l'usage de systèmes minimalistes ou de systèmes des années 1980, il me parait plus fécond de considérer la possibilité de configurer des environnements d'écriture adaptés, c'est à dire réduits à ce que l'auteur souhaite exprimer en terme de structure et de calcul, y compris presque rien donc.

WYSIWYM et environnements juste nécessaires

Nous proposons de considérer une application des environnements d'écriture WYSIWYM dans une logique de juste nécessaire, que l'on peut décliner selon deux hypothèses :

  • un éditeur WYSWIYM doit être configuré contextuellement à une écriture de façon à minimiser la perturbation et l'apprentissage inhérents à la dimension computationnelle ;

  • un éditeur WYSIWYM doit permettre de sortir du computationnel pour s'immerger pleinement dans l'écriture dès que c'est possible.

Spécialisation du WYSIWYM et modélisation de l'écriture

« L'approche WYSIWYG amène nécessairement l'auteur à se préoccuper de la forme et du résultat final. On connaît bien la surcharge cognitive et la perte de temps que cela entraîne, Powerpoint étant un must en la matière. (Spinelli, 2006) »

Si le WYSIWYG tend à plonger celui qui écrit dans un maelström de fonctions de mise en forme qui nuisent à son activité, le WYSIWYM porte en lui un risque du même ordre, en transférant du côté du calcul la charge qu'il a abandonnée du côté de la mise en forme. Or l'enjeu est de pouvoir se concentrer sur l'écriture et d'éviter de perdre du temps sur des manipulations contre-productives, qu'elles relèvent du graphique comme de la programmation. La spécialisation des éditeurs WYSIWYM permet de répondre à cet enjeu.

La spécialisation consiste à construire un éditeur spécifiquement pour adresser un contexte d'écriture donné : par exemple un éditeur de recette dans un restaurant sera différent d'un éditeur de documentation technique dans une industrie et d'un éditeur de cours dans une université. Par ailleurs, au sein de chaque contexte, les fonctions sont elles mêmes contextualisées : l'écriture d'un cours est différente de l'écriture d'un exercice, l'écriture d'une procédure est différente de la description d'une machine. Or pour réaliser un éditeur spécialisé de la sorte, il faut être capable d'en faire un modèle, c'est à dire d'en formaliser les fonctions, pour les anticiper et les rendre disponibles lorsqu'elles sont nécessaires, et, dans la mesure du possible, uniquement à ce moment là.

Les outils WYSIWYG peuvent difficilement s'inscrire dans cette logique car la mise en forme relève d'une pratique informelle difficilement modélisable. En revanche la dimension structurelle de l'écriture WYSIWYM est beaucoup plus facile à représenter formellement et à contrôler automatiquement. Il existe des outils WYSIWYM généralistes, comme LyX, des éditeurs HTML, ou XML basés sur des schémas standard comme Docbook, qui ne s'inscrivent pas non plus profondément dans cette logique de spécialisation. En revanche des outils comme Scenari sont totalement spécialisables.

« Connaissant le contexte métier de l'auteur, le modélisateur peut spécifier l'environnement d'édition juste nécessaire pour permettre à l'auteur de produire son information. De ce fait l'outil s'adapte à l'auteur et non l'inverse, et ceci est un des points fondamentaux qui rendent l'approche WYSIWYM réaliste (Spinelli, 2006). »

La rapport investissement/bénéfice de la spécialisation

Tandis qu'un éditeur généraliste est prêt à l'emploi, un éditeur spécialisé nécessite une étape de modélisation préalable, qui a un coût. Plus un éditeur est généraliste, plus la charge cognitive du côté de l'auteur est élevée (étant donné un certain spectre fonctionnel) ; plus un éditeur est spécialisé plus l'investissement en terme de modélisation est élevé (ainsi que le coût de maintenance de cette spécialisation). Il y a donc un rapport entre cet investissement et le bénéfice en terme de réduction de la charge sur les auteurs qui doit être évalué chaque fois, avant de procéder à une spécialisation. Le bénéfice est évidemment à mesurer pour chaque écrit produit par chaque auteur. Ainsi un écrit correspondant à une structure graphique et/ou computationnelle originale, sera en général mois favorable à la spécialisation que des écrits qui obéissent à des schémas récurrents.

Exemple d'éditeur généraliste Scenari  : Opale

Le modèle Scenari-Opale est le modèle le plus répandu dans la communauté Scenari. Or il est un contre exemple du point de vue de la spécialisation. En effet, le modèle fait l'union de ses nombreux contextes d'usage : cellules de rédaction universitaires, centres de formation professionnels, enseignants du primaire et secondaire, approches classiques expositives, approches plus appliquées, évaluation... Autant de milieux et fonctions qui le rendent de fait très généraliste. Il présente donc les mêmes avantages et défauts que les éditeurs WYSIWYM généralistes : il est prêt à l'emploi, mais il demande un investissement plus important en terme d'apprentissage et de charge cognitive à l'usage.

Inventer son écriture en écrivant : œuvres uniques, originalité, contextes artistiques

La modélisation implique une formalisation préalable à l'écriture, c'est à dire qu'elle suppose un modèle de structure identifiable qui pré-existe à l'écriture. Si cette hypothèse se vérifie pour la plupart des écrits ordinaires, qui répondent de fait à des codes et cadres déjà existants, il existe des cas où la structure s'invente en même tend que le contenu, par exemple dans le contexte de la littérature numérique ou du marketing. Dans un tel cadre la modélisation et la formalisation qu'elle impose sont contre-productives, puisqu'elles limitent ou ralentissent la créativité recherchée. De tels écrits mobilisent en général des éditeurs de bas niveau graphique, c'est à dire qui permettent d'intervenir à un niveau inférieur à celui du caractère, comme les outils de dessin vectoriel ; et/ou des outils de bas niveau informatique qui permettent de mobiliser des langages de programmation aux spectres très ouverts. Des technologies représentatives de ces modalités sont historiquement des outils comme Adobe Director puis Flash (et son langage ActionScript), et à présent HTML5 et la suite de technologies intégrées : SVG pour le vectoriel, Canvas pour le bitmap ou CSS et JavaScript pour la programmation.

Sortir du computationnel : environnement "zen"

Le WYSWIYM, en réintégrant la dimension computationnelle de l'écriture numérique, porte un risque de déplacement de l'attention sur la structuration, voire sur la programmation. Dans un environnement d'écriture Scenari, il est typiquement possible de se retrouver avec un contexte fonctionnel assez dense permettant de structurer, de fragmenter, de contrôler, de visualiser, de collaborer. Scenari permet de mettre le focus sur l'édition d'un fragment (une partie du texte), mais l'on pourrait souhaiter un environnement qui soit plus spécifiquement dédié à l'écriture du texte, avec un paramétrage différent en termes graphiques et une épuration fonctionnelle plus poussée. Du côté de la lecture, on retrouve cette approche dans la presse en ligne (interface zen du monde.fr) et au sein des liseuses électroniques.

Environnement d'écriture WYSIWYM "Zen"

Le premier écran présente un environnement d'écriture WYSIWYM Scenari complet. Le second montre l'interface d'écriture que j'utilise majoritairement, qui se limite à l'écriture d'une sous-partie du texte. Le troisième serait une vue "Zen" - ou une vue "Martin" - très épurée, qui pourrait être activée pour maximiser la concentration sur l'écriture.

Des phases dans l'écriture : l'idéation

La structuration inhérente au WYSIWYM suppose une projection dans son écriture, qui est cohérente avec les phases les plus en aval d'un processus éditorial, lorsque le projet a déjà pris une certaine forme. En revanche, pour les phases plus en amont, cela peut se révéler contre-productif. La phase d'idéation typiquement consiste à stimuler l'émergence des idées au début d'un projet, tout en les organisant petit à petit. L'idéation est aujourd'hui par exemple instrumentée avec des outils de mind-mapping (Framamind) ou des tableaux blancs collaboratif (Scrumblr). Si nous travaillons pour le moment sur des passerelles possibles entre ces outils et les chaînes éditoriales WYSIWYM (Hdoc Converter), il sera certainement intéressant que ces dernières intègrent des environnements d'écriture permettant la malléabilité et la dé-structuration nécessaires à l'idéation, tout en s'intégrant avec les phases suivantes de structuration.

Outils d'idéation

L'écriture essentiellement graphique

L'abstraction et la description de la structure est ce qui permet à la machine de calculer, la représentation graphique est ce qui permet à l'homme d'interpréter. Or il est des structures fondamentalement graphiques, pour lesquelles la recherche d'une abstraction ne fonctionne pas, c'est à dire que ce n'est pas efficiente (le rapport entre l'effort demandé à l'auteur et le gain en terme de manipulation n'est pas intéressant), voire n'est pas possible (l'auteur en cherchant à abstraire perd sa capacité d'expression). On citera deux exemples : les schémas et les tableaux. Pour ces deux cas typiquement graphiques il existe quelques situations pour lesquelles il est intéressant de proposer des éditions WYSIWYM, par exemple des schémas de procédures organisationnelles ou des tableaux de comptabilité. Mais en général les éditeurs WYSIWYM gagnent à repasser dans un mode purement WYSIWYG (dans Scenari cela se manifeste par l'intégration d'objets LibreOffice Calc et Draw, deux outils de dessin, vectoriel et tabulaire).

L'écriture essentiellement computationnelle

À l'inverse, on observe dans d'autres cas la nécessité de passer dans un mode de programmation de plus bas niveau. Certaines fonctions ne s'instancient que dans une couche de programmation plus explicite que celle habituellement mobilisée dans le WYSIWYM. Ainsi, pour programmer des scénarios complexes au sein de la chaîne éditoriale Topaze - multiplicité des chemins possibles, passages conditionnés, personnalisation des messages - il est nécessaire que l'auteur manipule des outils informatique, tels que des variables ou des conditions de type « si alors sinon ».

Exemple

http://7.crzt.fr/0101

Dans cet exemple de type « livre dont vous êtes le héros », (1) un quiz permet de demander au lecteur s'il est un garçon ou une fille  ; (2) puis d'instancier une variable « Genre » en fonction de la réponse à la valeur 1 (garçon) ou 2 (fille) ; (3) puis de calculer un texte en fonction de cette variable, ici le mot « fou » ou « folle » ; (4) pour enfin utiliser ce texte calculé : « Je suis impressionné par tes compétences de jardinier, jeune #fou(lle) ».

Conclusion : Pourquoi le WYSIWYG gagne encore ?

« Pour conclure : cela fait 20 ans maintenant que l'approche WYSIWYG est mise en oeuvre (avec des moyens financiers colossaux), aboutissant à une très grande maturité et stabilité technologique. Mais des nouveaux besoins massifs de gestion/diffusion de l'information combinés à l'avènement de l'interactivité et du multimédia mettent en évidence les limites intrinsèques de cette approche. (Spinelli, 2006) »

« le WYSIWYM est un concept émergent sur le quel nous avons encore peu de recul et peu de moyens ont été investis. Les précurseurs de cette approche sont les éditeurs historiques en ligne de commandes, mais la non exploitation de la force de la représentation graphique les cantonnent dans des milieux spécifiques où l'abstraction est reine : les math et l'informatique. Je crois profondément que WYSIWYM intégrant la dimension graphique est le ticket gagnant sur lequel il faut aujourd'hui investir ! (Ibid.) »