Martine et l’UTF-8

Imprimer la pageImprimer la page || VERSION PDF: Enregistrer au format PDF

La presse belge de ces derniers jours s’est largement étendue sur le décès du père de Martine.

Mais sait-on que Martine s’est aussi convertie à l’UTF-8, comme en témoigne la couverture d’un de ses tout derniers albums ? Elle suit là, l’exemple des membres de l’Urem de Bruxelles, qui n’encodent plus leurs fichiers LaTeX et Python qu’en UTF-8.

Rappelons que le passage à ce type d’encodage se fera tôt ou tard dans de nombreux domaines et qu’il ne s’agit pas là que d’une mode.

Par exemple :

  • L’éditeur TeXworks [1] utilise par défaut l’UTF-8,
  • Un des principaux apports de Python 3 est le support UTF-8
  • etc

Profitons de l’occasion pour signaler qu’il ne faut pas confondre la Norme Unicode et l’encodage UTF-8. Unicode affecte à un caractère (plus exactement un glyphe [2]) un code : ainsi, le “j” de l’alphabet cyrillique a pour code 1046. Unicode ne spécifie pas la manière dont sont encodés les caractères (sur deux, trois, voire quatre octets). On peut donc voir l’encodage UTF-8 comme une manière de satisfaire au standard Unicode.

[1] qui est désormais l’éditeur attaché à MikTeX

[2] Un glyphe est une représentation graphique (parmi une infinité possible) d’un signe typographique). Un glyphe est un peu comme un phonème en linguistique : une unité phonétique signifiante mais qui connaît en fait une infinité de réalisations

Mis en ligne le 22 janvier 2011 par Vermeiren Hugues