La « conomie » de la culture

C’est l’histoire d’un citoyen qui achète un petit e-book sur l’Internet.

Cet internaute utilise un « module complémentaire » de son navigateur Mozilla Firefox afin de visualiser directement le fichier (au format PDF) fraîchement acheté et il tombe sur la couverture suivante :
couverture

…et dans le texte c’est toujours « L’ conomie de la culture » !
accent

Tiens tiens !, le fournisseur a dû oublier de livrer les caractères accentués dans le colis (cela arrive même chez IKEA) et donc notre citoyen envoie un e-mail à la librairie immatériel.fr pour lui demander réparation des pièces manquantes ou-bien remboursement des 6€99 prélevés par carte Visa sur son compte.

Mais le libraire, par la voie de ses directeurs n’entend pas rembourser notre pauvre citoyen ! Pourquoi ? parce que cet personne a eu l’idée saugrenue d’utiliser un « plugins » Open-Source et intégré au navigateur Web quand le bon consommateur culturel averti, lui, utilise le logiciel propriétaire AcrobatReader d’Adobe. Effectivement, si on utilise ce beau logiciel la « conomie » semble remplacée par la majestueuse et très sérieuse « Économie de la Culture ».  L’histoire pourrait s’arrêter là si notre citoyen n’avait pas été un peu plus curieux !

Le PDF, format de notre livre numérique est un langage de description de données pour les écris et qui a historiquement remplacé le PostScript.  Il est comme ce dernier compréhensible directement par les imprimantes et autres machines d’impression professionnelles. Ce n’est pas un format facile à lire pour les humains et ce n’est pas ce qu’on lui demande. Les deux principales exigences sont :

  • Le langage doit être assez économe en ressources; taille des données et rapidité d’accès et de rendu d’une page.
  • stabilité du rendu final dans l’espace (exactement la même image à l’écran ou sur imprimante quelque soit le système opératoire de l’ordinateur ou la marque de l’imprimante), mais aussi dans le temps car on désire pouvoir relire en 2050 les bons vieux documents écris de 1993.

Malgré quelques petits défauts parfois surprenants, mais de détails, le PDF s’acquitte pas trop mal des précédentes exigences et personne n’ose trop lui contester le nom de « Portable Document Format ». La meilleur preuve est que la communauté scientifique toute entière publie depuis plusieurs années au format PDF. Rappelons que comme PostScript, c’est un format vectoriel et donc vous pouvez admirer la calligraphie du texte avec un puissant zoom (on reconnaît immédiatement le « g » Computer Modern);

zoom

Le PDF est avant tout une spécification ouverte d’un format. Cela veut dire que la recette de ce format n’est pas secrète contrairement à certaines implémentations, dont Acrobat Reader si bien que la communauté des développeurs Libre/Open-Source a réalisé depuis longtemps des logiciels de lecture répondant parfaitement à cette spécification (Evince, Okular, Xpdf,…). Notons que si cette recette avait été secrète, le monde de la recherche aurait sûrement proposé un format ouvert alternatif !

Quand on regarde d’un peu plus près ce format, on découvre qu’il est fait de tables de nombreux pointeurs, sorte de raccourcis informatique pour accéder directement à une partie des données sans lire tout le contenu. Cette simple fonctionnalité vous permet si l’outil de lecture est suffisamment bien conçu d’accéder à n’importe quelle page d’un document PDF qui en contient plusieurs milliers quasiment instantanément et comme ce format supporte aussi la notion d’hyperlien, vous pouvez naviguer entre différentes sections de différents documents PDF très rapidement, théoriquement beaucoup plus rapidement qu’avec le format HTML ou XML, conçu au départ pour rester lisible (il ne l’est plus), donc au prix d’une moindre efficacité (vitesse de rendu et taille de fichier). Donc l’avenir proche va voir apparaître des lecteurs PDF complètement intégrés aux navigateurs Web et utilisant des options du protocole HTTP (‘range request’) pour afficher instantanément des pages PDF à l’écran (il n’y a aucune raison d’avoir une barre d’attente de chargement). C’est dans cette optique que s’inscrit l’outil utilisé par notre citoyen malchanceux, qui ne désire pas changer et revenir en permanence entre son navigateur internet et son lecteur PDF.

Les fins analystes de la librairie immateriel.fr ont vite fait de faire remarquer que le module complémentaire en question était encore en développement, car une activité intense est visible sur GitHub, et donc que fort probablement, le problème de notre citoyen est dû à un « bug » de jeunesse du logiciel. Actuellement, cette assertion n’est pas prouvée, ni son contraire. Ce n’est pas si étrange quand on sait ce qu’est une spécification. Malgré tous les efforts pour la rendre la plus complète et la plus cohérente possible, et celle du format PDF fait environ 1000 pages sur plusieurs documents, il reste toujours des zones non spécifiées ou sujettes à interprétation. Donc deux implémentations différentes de lecteur PDF peuvent fournir un résultat à l’écran différents et l’outil réalisé par le spécificateur (Adobe) n’est en soit pas plus une référence qu’un autre outil qui respecterait la spécification.

Or notre vendeur, Immatériel.fr fait bien apparaître sur son site que le fameux livre est au format PDF qui plus est sans DRM (voir aussi le couverture). Soit le vendeur oblige le consommateur explicitement ou implicitement à utiliser l’outil Acrobat Reader  et dans ce cas le fichier est vendu avec un mécanisme qui s’apparente à un DRM et contredit la publicité du site, soit il accepte d’analyser la défaillance du fichier sur tout type de lecteur afin de déterminer les responsabilités et le cas échéant rembourser l’acheteur mécontent s’il s’agit d’une erreur de conception du document (et non de l’outil).

Partons sur la deuxième option car pour la première, il ne serait pas trop difficile de trouver un jeune avocat en mal d’affaire pour défendre cette cause (je fais en passant un appel à candidature…si vous êtes avocat!). Prenons le mot « phénomène » trouvé page 4 du livre. Comment les concepteurs du livre l’ont-ils écrit en PDF ?

Il faut pour cela chercher la « stream » correspondante et la décompacter. La chaîne de caractère pour écrire seulement le mot « phénomène » est

-260.4(ph)]TJ
/F6 1 Tf
5.6876 0 TD
(é)Tj
/F8 1 Tf
0.495 0 TD
(nom)Tj
/F6 1 Tf
2.196 0 TD
(è)Tj
/F8 1 Tf
0.495 0 TD
(ne.)Tj
/F6 1 Tf
1.6903 0 TD

On remarque que à chaque fois que l’on rencontre un caractère accentué (hors ASCII), le concepteur fait une opération de changement de police de caractères en définissant son nom et sa taille (opérateur Tf) suivi d’une opération de recalage de la position x et y du point courant sur la page (opérateur TD).
Rassurez vous, il existe des polices de caractère pour écrire tous les langages dont le français. Par exemple, si on analyse le même mot « phénomène » écrit à partir d’une chaîne de production documentaire gratuite et largement disponible LaTeX, alors la sous chaîne dans le document PDF peut être alors (il y a plusieurs solutions de même taille):

(ph)28(')472(enom)28(`)472(ene.)

Les choix de la police de caractère et sa taille sont préalablement fais en début de paragraphe. Les chiffres ajustent le « kerning » pour placer harmonieusement chaque couple de lettre. C’est une tâche principale de PDF.

Il n’y a pas besoin d’être calligraphe professionnel pour comprendre que le second codage est simple, logique, presque lisible par un humain, quand le premier prend de 4 à 5 fois plus de place, est complètement illogique. Cela a des conséquences sur la taille final du fichier PDF (occupation mémoire) ainsi que sur le temps d’affichage des pages, donc sur le confort de lecture.
La raison du premier codage, celui de notre livre sur la « conomie de la culture », est sûrement dû à un empilage d’outils informatique mal conçus qui donne un résultat tellement absurde que même la spécification du format n’a pas pensé à ajouter une règle du type:

Ne pas changer de police de caractère à l’intérieur d’un mot ou dans un cas qui n’est pas visible pour le lecteur (passage en gras, italique, petite capitales,….).

C’est l’histoire du chat dans le micro-onde. Tant que personne ne l’avait fait, les notices de micro-onde n’incluaient pas la mention « ne pas mettre un animal dans le micro-onde pour le faire sécher », mais il suffit qu’une personne ait assez d’imagination pour tenter l’expérience et visiblement les concepteurs du fameux livre sont assez doués dans ce sens, pour qu’il y ait « oubli de spécification ». Donc il faudra attendre une révision de la spécification pour ajouter l’équivalent du « chat dans le micro-onde » pour le format PDF.

La petite différence avec l’histoire du chat est que le consommateur internaute n’a pas fait de mauvaise utilisation, on lui impose un codage avec les pieds et le plus fort, c’est que s’il venait à l’esprit de cet internaute de corriger le document (un peu de temps de programmation pour sortir une bonne moulinette sans trop de difficulté), alors il n’est pas impossible que notre libraire ou son éditeur accuse notre pauvre citoyen de rompre les règles du droit d’auteur, voire même de se mettre en situation de faire de la prison pour contrefaçon.

Vous pensez que notre citoyen se prend bien la tête pour un bouquin à moins de 10€. En fait cette histoire est révélateur de la « Conomie » de la Culture avec l’arrivée du Numérique. Immatériel.fr fait valoir que l’éditeur en question « ditions La D couverte » à plus de 30 ans d’expérience de l’édition, sous entendu que personne ne peut lui apprendre les règles de composition et mise en page d’un ouvrage. Cette vénérable maison a simplement oublié que le support du livre a changé ou est en train de changer. Quand seul le rendu final sur la page compte sur un livre imprimé. En revanche, pour un livre électronique, il y a en plus la taille du fichier, le temps de chargement des pages qui peuvent influencer le confort de lecture. Tout n’est pas de la responsabilité de développeur de l’outil de lecture, ni du lecteur lui même (contre l’argument qu’on peut toujours lire un texte français sans accent!). Une simple reconnaissance de la mauvaise conception du PDF aurait sûrement réconforté notre pauvre lecteur mais la petite histoire bloque au point qu’Immateriel.fr refuse la demande de remboursement et campe dans sa position de non responsabilité totale.

Il faut savoir chers amis que ce même Immatériel.fr fait parti d’un groupe de travail MO3T financé actuellement à hauteur de 3M€ par nos impôts. Ce groupe est sensé proposer en Septembre 2013, donc sous peu, une plate-forme assurant la pérennité des e-book à tout acheteur pour toute sa vie et même après car il envisage un cadre légal pour traiter l’héritage de bien immatériels. Comment peut-on s’afficher d’un coté dans un projet qui défendrait les intérêts du consommateur à condition que ce dernier achète « légalement » le livre, et de l’autre refuser à un simple citoyen un remboursement (ou une correction) pour un fichier PDF mal composé ? L’histoire pourtant courte de l’Internet à montré qu’il vaut mieux être modeste et pas trop arrogant sur certains certitudes du monde physique car elles peuvent se révéler sans fondement dans le monde du Numérique.

Cet livre au format numérique est triplement exemplaire;

  • son titre évocateur la « conomie de la Culture » Numérique illustre bien la défaillance de conception précédemment mis en évidence sur le format PDF. Il se trouve qu’il y a beaucoup de chose à dire sur la « Conomie » en matière de Numérique.
  • le contenu de ce livre devant aussi traiter de la « conomie de la Culture » à l’aire du Numérique, le lecteur est très déçu qu’il n’y ait pas de véritable prospective des conséquences pourtant sensibles qu’Internet impose et imposera à la Culture, ne serait ce que par le caractère immatériel de nombreuses œuvres.
  • ce petit livre est soit un outil d’enseignement (il est précisé en couverture: « idéal pour les étudiants »), soit un outil de recherche et la page « Économie de la culture » de Wikipedia le référence en premier. Dans les deux cas, il serait normal et plus encore pour une version électronique qui ne demande aucun effort d’impression que ce texte soit publié en licence libre de droit (par exemple Creative Commons BY). Nous ferons une demande dans ce sens auprès de l’auteur, le professeur Françoise Benhamou.

On remarquera que l’e-book est vendu au même prix que le livre papier et donc comme il n’y a aucun frais d’impression, diffusion, transport, il y a bien quelqu’un qui se met cette marge dans la poche, et je ne pense pas que ce soit l’auteur. Un comique m’a même répondu un jour qu’il y avait des frais pour scanner les documents !!

Donc par ce petit post, nous inaugurons une longue bataille avec le soutient je l’espère d’un maximum d’internautes. Nous n’excluons pas l’idée d ‘ester en Justice (quel tribunal ?) mais celle ci avançant lentement sur les affaires liées au Numérique, cela peut prendre du temps,et j’en profite pour faire appel à toute bonne volonté de formation plus juriste que la mienne pour discuter des possibles recours.

Je compte soumettre d’ici peu une pétition exigeant pour tous citoyen consommateur des e-book au format PDF de qualité (on détaillera cette notion), bien entendu sans DRM dès lors qu’ils sont vendus. Sachez qu’il est aisé de transformer un PDF en d’autres formats dont EPUB pour changer la taille des polices à l’écran, mais le format désiré par l’auteur reste le PDF, car respectueux de sa mise en page initiale et intégrable à un navigateur web de son choix. On voit donc en passant que le choix du format est un problème réglé depuis des années et cela constitue plus un prétexte de travail du projet MO3T qu’une demande utilisateur. Dès l’instant que l’e-book est augmenté avec de nombreux éléments dynamiques (vidéo, son, animations,…), cela devient une véritable application logicielle autonome, mais liée au système opératoire et donc sujette aux aléas de l’évolution du l’informatique, donc plus un document. Mais un document, un vrai, reste et restera statique, autonome et lisible dans 50 ans sur n’importe quel appareil. D’ailleurs, certaines contraintes sur le PDF noté PDF/A sont normalisées pour l’archivage (ISO 19005-1).

Analysons maintenant un trait fort étrange de la « conomie » de la Culture. Il est reconnu et regardez sur le Net pour en être convaincu que les chaînes d’outils documentaire à base de TeX/LaTeX surpassent largement en qualité tout ce qui peut être fait avec la dernière version de Microsoft Word ou de son équivalent libre (OpenOffice, LibreOffice). Le simple fait d’utiliser par défaut des polices de caractère « computer modern » non disponibles sur les ordinateurs oblige le PDF a les embarquer de façon optimale (sous ensemble des caractères réellement utilisé) et garantit ainsi que le document est rendu exactement à l’identique sur tous les écrans ou imprimantes, alors que depuis la version 1.7 de PDF, tout document utilisant la police Helvetica sera rendu sous MS Windows avec la police différente Arial. PDF admet donc une entorse à l’exigence initiale de stabilité du résultat (PDF/A en revanche oblige l’incorporation de toutes les polices), et ce défaut est insensible si le document est initialement crée en TeX/LaTeX. Mais le point important est de rappeler que cette chaîne est gratuite, ouverte depuis exactement 30 ans! Elle est donc d’une stabilité sans trop d’égale dans les objets crées par l’histoire de l’informatique si bien que n’importe qui peut sans hésiter lui faire confiance pour garder au delà de sa mort ses écris les plus importants.  Cet argument devrait faire mouche auprès de tous les humanistes; écrivains, philosophes, historiens qui visent la postérité d’autant plus que la partie difficile de TeX/LaTeX à savoir le mode mathématique n’est pas requise par la grande majorité des écrivains. On s’attendrait donc à ce que nos auteurs favoris soient les premiers utilisateurs de LaTeX. Pourquoi n’est ce absolument pas le cas ?

J’avance que la raison profonde révèle une situation très analogue à celle qui existait au Moyen-Age entre les seigneurs et les paysans. Si tu ne me donnes pas une bonne partie de ta récolte, alors je n’assure plus ta sécurité et tu te feras massacré par le seigneur voisin. Un éditeur dit aujourd’hui à un auteur: si tu ne me donnes pas tous tes droits sur ce livre, alors aucune chance que tu concours pour le Goncourt ou que tu sois même publié dans la petite librairie de ta région. Puis, pour faire croire au yeux de tous que le métier de l’édition demande une expertise très forte, dont coûteuse, toi auteur, tu ne dois absolument pas faire de mise en page, laisser les professionnels travailler avec leurs outils qui coûtent très très cher et trop complexe à utiliser. Enfin, nous nous occupons de la partie commerciale, distribution, promotion et toutes les tâches qui ne passionnent pas l’artiste que tu es. La menace tient encore beaucoup en littérature alors qu’elle a essuyé certaines défaites dans le mode de l’édition scientifique. Les scientifiques voyant leur publication LaTeX reproduites à l’identique par l’éditeur se sont questionnés sur la plus-value de ce dernier. Reste encore un chantage et une pression sur les comités de lecture, mais il semblerait que les sciences aient plus ou moins acquis la maturité de l’autoédition numérique et diffusion instantanée, distribuée par l’Internet, validée par les pairs. On constate que coté Humanités, alors que les conditions sont normalement plus faciles, les conservatismes féodaux demeurent bien ancrés. Il est certain qu’il ne résisteront pas à la vague du Numérique, mais l’incertitude porte sur le temps de résistance et le niveau de préparation et de réparation des anciens acquis. LaTeX est l’arme la plus menaçante pour les éditeurs car tout apprentissage qui se repend par l’Internet ouvre un peu plus les yeux des auteurs dans la mutation plus ou moins brutale qu’ils commence à vivre. On pourra même en surprendre certains en disant que l’auto-publication, avec rémunération à 100%, contact direct avec les lecteurs, sans intermédiaire, même pas Visa, est bientôt possible.

Enfin nous pourrons abandonner la « conomie » de la culture pour laisser se développer une Économie de la Culture, bien intégrée au monde Numérique.

Voir le projet cupfoundation.net

Laurent Fournier

NB: Un esprit malin me fera remarquer que je n’utilise pas LaTeX, mais WordPress pour ce post. D’une part je ne considère pas ce post comme un écrit d’une quelconque qualité litéraire et d’autre part ce sera bientôt corrigé. Je proposerai un PDF de contenu équivalent (intégrant peut être certaines remarques de lecteurs), mais comme très peu de personnes ont un lecteur PDF intégré à leur navigateur Web, certains pourrait éviter la lecture par la simple contrainte de voir et devoir télécharger un PDF.

Publicités

Une réflexion au sujet de « La « conomie » de la culture »

  1. Ping : Le ⊔Store ! | ⊔Foundation

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s