<oXygen/> XML Editor User Guide

Chapitre 4. Édition des documents

Travailler avec Unicode

Unicode donne un numéro unique pour chaque caractère, peu importe quelle plateforme, quel programme, quelle langue. Unicode est un standard reconnu internationalement, adopté par les leaders du secteur. Unicode est requis par les standards modernes comme XML, Java, ECMAScript (JavaScript), LDAP, CORBA 3.0, WML, etc., et est la façon officielle d'implémenter ISO/IEC 10646.

Il est supporté par de nombreux systèmes d'exploitation, tous les navigateurs modernes, et de nombreux autres produits. L'émergence du standard Unicode, et la disponibilité des outils le supportant, sont parmi les plus importants courants actuels de la technologie logicielle dans le monde. Incorporer Unicode dans des applications client-server ou multi-couches et les sites web offre des réductions de coûts signifiques par rapport à l'utilisation de jeux de caractères précédents.

En tant qu'éditeur XML moderne, <oXygen/> offre le support pour le standard Unicode standard permettant à votre application XML d'être ciblée vers de multiples plateformes, langues et pays sans re-développement. En interne l'éditeur XML <oXygen/> utilise des caractères 16bit couvrant le jeu de caractères Unicode.

Au chargement de documents de type XML, XSL, XSD et DTD, <oXygen/> lit le prolog du document pour déterminer le type d'encodage spécifié. Cela est ensuite utilisé pour ordonner au Java Encoder de charger le support correspondant et de sauver en utilisant le jeu de caractères spécifié. Au cas où le type d'encodage ne peut être déterminé, <oXygen/> va afficher le dialogue des Encodages Java disponibles. Ce dialogue offre une liste de tous les codages supportés par la plateforme Java.

Figure 4.1. Dialogue des encodages Java disponibles

Dialogue des encodages Java disponibles

Bien que dans la plupart des cas vous utiliserez UTF-8, simplement changer le nom de l'encodage va provoquer la sauvegarde du fichier avec le nouvel encodage. L'annexe Encodage des caractères Unicode offre un tableau qui donnent les noms Java de leurs équivalents communs. Elle explique aussi ce que vous devez taper dans le prolog XML pour que le document soit sauver dans l'encodage souhaité.

Pour éditer les documents écrits en Japonais ou Chinois, vous devrez changer la police pour en choisir une qui supporte les caractères spécifiques (une police Unicode). Pour la plateforme Windows, utiliser Arial Unicode MS ou MS Gothic est recommandé. Ne vous attendez pas à ce que Wordpad ou le Bloc-notes gèrent ces encodages. Utilisez Explorer ou Word pour examiner éventuellement les documents XML.

[Note]Note

La convention pour le nommage utilisé sous Java ne correspond pas toujours avec les noms communs utilisés par le standard Unicode. Par exemple, tandis qu'en XML on utilise encoding="UTF-8", en Java le même encodage a le nom "UTF8".