Accéder au contenu France-Français
Accueil HP.com France Produits et Services Support et Pilotes Espaces Comment Acheter
» Contacter HP
Plus d'options
Accueil HP.com France
Livre blanc sur les fonctionnalités d'internationalisation HP-UX 11.0 - 11i > Chapitre 2 Codage des caractères

Conversion entre codages

» 

Documentation technique

Manuel complet en PDF
» Commentaires
Début du contenu

 » Table des matières

 » Glossaire

 » Index

Mappages de caractères corrigés pour iconv (1) et iconv (3C) [correctif 11.0, 11i v1]

Cette version contient des correctifs pour des mappages de caractères incorrects. Ces corrections concernent les caractères en chinois simplifié, chinois traditionnel, japonais et coréen de HP-UX.

Les corrections de mappage de conversion de caractère améliorent l'interopérabilité lors de l'envoi ou de la réception de données de caractères convertis vers et à partir de systèmes compatibles Unicode.

Correction pour le chinois simplifié

Un correctif règle un mappage de caractère incorrect qui se produit lors de la conversion entre hp15CN et Unicode (UCS2)/UTF-8 pour le chinois simplifié.

Plus spécifiquement, le caractère de chinois simplifié Double ligne verticale était mappé de manière incorrecte lors de la conversion entre hp15CN et UCS2/UTF-8. Ce caractère était mappé au caractère Parallèle à, qui est un caractère différent.

Le Tableau 2-19, « Modifications apportées aux tables iconv pour le chinois simplifié » récapitule les modifications appliquées aux tables iconv :

Tableau 2-19 Modifications apportées aux tables iconv pour le chinois simplifié

hp15CNUCS2 incorrectUCS2 correctNom du caractère
0xA1CE 0x2225Parallèle à
0xA1AC0x22250x2016Double ligne verticale
 

Les tables de conversion iconv hp15CN=ucs2 et ucs2=hp15CN sont affectées. Ces tables sont partagées par les conversions UCS2 et UTF-8.

Aucun problème de compatibilité n'est attendu. Toutefois, en cas d'inquiétude concernant la compatibilité des données persistentes stockées en Unicode (UCS2) ou UTF-8 sur un système HP-UX, il est possible de générer un script de conversion simple afin de rechercher chaque ocurrence d'une valeur incorrecte en UCS2 ou UTF-8 et de la convertir en valeur correcte en fonction du mappage donné dans le Tableau 2-20, « Mappage entre anciens et nouveaux caractères Unicode pour le chinois simplifié ».

Tableau 2-20 Mappage entre anciens et nouveaux caractères Unicode pour le chinois simplifié

Ancien UCS2UCS2Ancien UTF-8UTF-8Nom du caractère
0x22250x20160xe288a50xe28096Double ligne verticale

 

Correction pour le chinois traditionnel

Un correctif règle plusieurs mappages de caractères incorrects qui se produisent lors de la conversion entre Big-5/EUC et Unicode (UCS2)/UTF-8 pour le chinois traditionnel.

Dans le cas du codage big5 vers et à partir de UCS2/UTF-8, le caractère Espace idéographique était absent dans le mappage de table de conversion Unicode :

Tableau 2-21 Modifications apportées aux tables iconv pour big5/Unicode

big5UCS2 incorrectUCS2 correctNom du caractère
0xA140  0x3000Espace idéographique
 

Le tableau suivant récapitule les modifications apportées pour les conversions entre eucTW et UCS2.

Tableau 2-22 Modifications apportées aux tables iconv pour eucTW/Unicode

eucTWUCS2 incorrectUCS2 correctNom du caractère
0xa1a60x30fb0x2022Puce
0xa1b70x20140x2013Tiret demi-cadratin
0xa1b90x20130x2014Tiret cadratin
0xa1b60xfe310xff5cLigne verticale pleine chasse
0xa1b8 0xfe32 0xfe31Forme de présentation de tiret demi-cadratin vertical
0xa1ea 0x2032 0x2035 Prime réfléchi
0xa1eb0x2035 0x2032 Prime
0xa2b90x22640x2266Plus petit que par dessus Égal à
0xa2ba0x22650x2267Plus grand que par dessus Égal à
0xa2c20xfe660xfe65Signe Supérieur à minuscule
0xa2c30xfe650xfe66Signe Égal à minuscule
0xa2de0xff5c0x2223Est un diviseur de
0xa2e10xfe670xff0f Barre oblique pleine chasse
0xa2e40xffe50x00a5Signe Yen
0xa2e60xffe00x00a2Signe Cent
0xa2e70xffe10x00a3Signe Livre
 

Les conversions iconv entre eucTW et UCS2 ou UTF-8 peuvent être affectées.

Les conversions Big-5 avec UCS2/UTF-8 ne sont pas affectées directement puisqu'une seule entrée de table manquante a été ajoutée.

Les tables de conversion iconv eucTW=ucs2, ucs2=eucTW, big5=ucs2 et ucs2=big5 sont affectées. Ces tables sont partagées par les conversions UCS2 et UTF-8.

Aucun problème de compatibilité n'est attendu. Toutefois, en cas d'inquiétude concernant la compatibilité des données persistentes stockées en Unicode (UCS2) ou UTF-8 sur un système HP-UX, il est possible de générer un script de conversion simple afin de rechercher chaque ocurrence d'une valeur incorrecte en UCS2 ou UTF-8 et de la convertir en valeur correcte en fonction des mappages donnés dans le Tableau 2-23, « Mappage entre anciens et nouveaux caractères Unicode pour le chinois traditionnel ».

Tableau 2-23 Mappage entre anciens et nouveaux caractères Unicode pour le chinois traditionnel

Ancien UCS2UCS2Ancien UTF-8UTF-8Nom du caractère
0x30fb0x20220xe383bb0xe280a2Puce
0x20140x20130xe280940xe28093Tiret demi-cadratin
0x20130x20140xe280930xe28094Tiret cadratin
0xfe310xff5c0xefb8b10xefbd9cLigne verticale pleine chasse
0xfe32 0xfe310xefb8b20xefb8b1Forme de présentation de tiret demi-cadratin vertical
0x2032 0x2035 0xe280b20xe280b5Prime réfléchi
0x2035 0x2032 0xe280b50xe280b2Prime
0x22640x22660xe289a40xe289a6Plus petit que par dessus Égal à
0x22650x22670xe289a50xe289a7Plus grand que par dessus Égal à
0xfe660xfe650xefb9a60xefb9a5Signe Supérieur à minuscule
0xfe650xfe660xefb9a50xefb9a6Signe Égal à minuscule
0xff5c0x22230xefbd9c0xe288a3Est un diviseur de
0xfe670xff0f 0xefb9a70xefbc8fBarre oblique pleine chasse
0xffe50x00a50xefbfa50xc2a5Signe Yen
0xffe00x00a20xefbfa00xc2a2Signe Cent
0xffe10x00a30xefbfa10xc2a3Signe Livre

 

Correction pour le japonais

Un correctif règle quatre mappages de caractères japonais incorrects qui se produisent lors de la conversion entre Shift-JIS/EUC et Unicode (UCS2)/UTF-8.

Le tableau suivant récapitule les modifications appliquées.

Tableau 2-24 Modifications apportées aux tables iconv pour le japonais

sjiseucJPUCS2 incorrectUCS2 correctNom du caractère
0x81500xA1B10xFFE30x203ESurligné
0x815C0xA1BD0x20150x2014Tiret cadratin
0x818F0xA1EF0xFFE50x00A5Signe Yen
S/O0x8FA2B70x02DC0xFF5ETilde pleine chasse
 

Les conversions iconv affectées sont celles entre sjis et UCS2 ou UTF-8, ainsi que celles entre eucJP et UCS2 ou UTF-8.

Les tables de conversion iconv sjis=ucs2, ucs2=sjis, eucJP=ucs2 et ucs2=eucJP sont affectées. Ces tables sont partagées par les conversions UCS2 et UTF-8.

Aucun problème de compatibilité n'est attendu. Toutefois, en cas d'inquiétude concernant la compatibilité des données persistentes stockées en Unicode (UCS2) ou UTF-8 sur un système HP-UX, il est possible de générer un script de conversion simple afin de rechercher chaque ocurrence d'une valeur incorrecte en UCS2 ou UTF-8 et de la convertir en valeur correcte en fonction des mappages donnés dans le Tableau 2-25, « Mappage entre anciens et nouveaux caractères Unicode pour le japonais ».

Tableau 2-25 Mappage entre anciens et nouveaux caractères Unicode pour le japonais

Ancien UCS2UCS2Ancien UTF-8UTF-8Nom du caractère
0xFFE30x203E0xefbfa30xe280beSurligné
0x20150x20140xe280950xe28094Tiret cadratin
0xFFE50x00A50xefbfa50xc2a5Signe Yen
0x02DC0xFF5E0xcb9c0xefbd9eTilde pleine chasse

 

Correction pour le coréen

Un correctif règle une non-conformité aux normes pour les mappages de caractères Unicode coréens (UCS2)/UTF-8.

Les tables de conversion iconv actuellement fournies pour le coréen ne sont pas conformes aux normes Unicode 2.1 et ISO 10646 (avec amendements de 1997) en plus de la norme nationale coréenne, KSC-5700. Les mappages actuels sont considérés comme obsolètes par toutes les organisations de normalisation concernées.

L'amélioration fournit un jeu de tables de conversion iconv conformes aux normes pour la conversion entre eucKR et Unicode/UTF-8. Plus spécifiquement, la plage obsolète 0x3d2e-0x4dff a été remappée à la plage 0xac00-0xd7ff spécifiée dans Unicode 2.1 pour le Hangûl.

Sans cette modification, il est impossible de partager des données avec d'autres systèmes qui adhèrent aux normes Unicode 2.1/ISO 10646/KSC-5700.

Les conversions iconv affectées sont toutes les conversions entre eucKR et UCS2 ou UTF-8.

Les tables de conversion iconv affectées par cette modification sont eucKR=ucs2 et ucs2=eucKR. Ces tables sont partagées par les conversions UCS2 et UTF-8.

Aucun problème de compatibilité n'est attendu. Toutefois, en cas d'inquiétude concernant la compatibilité des données persistentes stockées en Unicode (UCS2) ou UTF-8 sur un système HP-UX, il est recommandé d'enregistrer et de renommer la table ucs2=eucKR précédemment installée avant d'installer ce correctif. Les données persistentes peuvent être reconverties en eucKR à l'aide de cette ancienne table, puis reconverties en présentation Unicode/UTF-8 correcte.

Convertisseurs iconv relatifs aux Japan Vendor Council [11i v1.6]

De nouveaux convertisseurs iconv ont été introduits afin d'autoriser une plus grande interopérabilité de partage des données avec les environnements informatiques japonais. Les éléments suivants sont liés à ce changement :

  • De nouvelles tables de conversion iconv pour le japonais sont maintenant disponibles et conformes aux recommandations du groupe de travail technique CDE/Motif de l'Open Group Japanese Vendor Council (TOG/JVC), qui garantissent une interoperabilité d'ISO 10646/Unicode/JIS X0221 avec les environnements informatiques japonais.

    REMARQUE : JIS X0221 est la norme nationale japonaise équivalente à ISO-10646:1993 et Unicode 2.1.

    Ces tables permettent d'effectuer la conversion entre les caractères Shift-JIS (SJIS) et EUC HP et ceux spécifiés par l'interprétation stricte JIS X0201 ainsi que les mappages Microsoft Unicode et UTF-8. Les mappages de conversion JIS X0221 Extended sont déjà pris en charge dans HP-UX. Ces nouveaux mappages nécessitent 0,6 Mo d'espace supplémentaire.

    Le Tableau 2-26, « Nouveaux convertisseurs iconv » montre huit nouvelles tables de conversion iconv qui sont fournies afin de prendre en charge les mappages alternés dans les conversions cycliques entre EUC et Shift-JIS (SJIS) vers/à partir de Unicode et UTF-8.

    Tableau 2-26 Nouveaux convertisseurs iconv

    Conversion

    Interprétation

    eucJP0201 <-> ucs2

    JIS X0201
    eucJPMS <-> ucs2Microsoft
    sjis0201 <-> ucs2JIS X0201

    sjisMS <-> ucs2

    Microsoft

     

    Le Tableau 2-27, « Variations de mappages entre mappages SJIS et Unicode » illustre les variations de mappages entre les tables de conversion lors de la conversion entre SJIS et différentes interprétations des mappages de caractères Unicode.

    REMARQUE : Les mappages JIS X0201 Extended (Unix) sont déjà disponibles dans HP-UX, référencés dans ce tableau en tant que SJIS.

    Tableau 2-27 Variations de mappages entre mappages SJIS et Unicode

    SJIS

    mappage UCS2 sjis0201mappage UCS2 SJISmappage UCS2 sjisMS

    0x5C

    0x00A50x005C0x005C

    0x7E

    0x203E0x007E0x007E

    0x8150

    0xFFE30x203E0xFFE3
    0x815F0x005C0xFF3C0xFF3C

    0x818F

    0xFFE50x00A50xFFE5
    0x815C

    0x2014

    0x2014

    0x2015

    0x8160

    0x301C

    0x301C

    0xFF5E

    0x8161

    0x2016

    0x2016

    0x2225

    0x817C

    0x2212

    0x2212

    0xFF0D

    0x8191

    0x00A2

    0x00A2

    0xFFE0

    0x8192

    0x00A3

    0x00A3

    0xFFE1

    0x81CA

    0x00AC

    0x00AC

    0xFFE2

     

    Le Tableau 2-28, « Variations de mappages entre mappages EUC et Unicode » illustre les variations de mappages entre les tables de conversion lors de la conversion entre EUC et différentes interprétations des mappages de caractères Unicode.

    REMARQUE : Les mappages JIS X0201 Extended (Unix) sont déjà disponibles dans HP-UX, référencés dans ce tableau en tant que eucJP.

    Tableau 2-28 Variations de mappages entre mappages EUC et Unicode

    EUC

    mappage UCS2 eucJP0201mappage UCS2 eucJPmappage UCS2 eucJPMS

    0x5C

    0x00A50x005C0x005C

    0x7E

    0x203E0x007E0x007E

    0xA1B1

    0xFFE30x203E0xFFE3
    0xA1C00x005C0xFF3C0xFF3C

    0xA1EF

    0xFFE50x00A50xFFE5
    0xA1BD

    0x2014

    0x2014

    0x2015

    0xA1C1

    0x301C

    0x301C

    0xFF5E

    0xA1C2

    0x2016

    0x2016

    0x2225

    0xA1DD

    0x2212

    0x2212

    0xFF0D

    0xA1F1

    0x00A2

    0x00A2

    0xFFE0

    0xA1F2

    0x00A3

    0x00A3

    0xFFE1

    0xA2CC

    0x00AC

    0x00AC

    0xFFE2

    0x8FA2B7

    0x007E

    0xFF5E0xFF5E

    0x8FA2C3

    0x00A60x00A60xFFE4

     

  • Le TOG/JVC a formalisé trois mappages de conversion possibles pour plusieurs caractères. Il s'agit de :

    1. JIS X0221 basé sur une stricte interprétation de la norme JIS X0201

    2. JIS X0221 Extended qui autorise une plus grande coexistence dans les environnements ASCII actuels (tels qu'Unix)

    3. JIS X0221 basé sur les mappages japonais de Microsoft

Améliorations de iconv pour la prise en charge de l'euro grec [11i v1.6]

Pour des informations détaillées sur les améliorations apportées à iconv pour la prise en charge de l'euro grec, voir la section « Prise en charge de l'euro grec [11i v1.6] ».

Convertisseurs iconv mainframe pour les caractères japonais [correctif 11.0, correctif 11i v1, 11i v2]

Des convertisseurs iconv mainframe entre ShiftJIS/eucJP/UCS2 et NEC-JIPS/Hitachi-KEIS/Fujitsu-JEF ont été introduits dans HP-UX 11i v1.0. Cette version inclut plusieurs correctifs qui résolvent des erreurs de mappage pour des caractères standard JIS.

Cette version des tables de conversion iconv mainframe inclut de nombreux correctifs qui résolvent des erreurs de mappage pour des caractères standard JIS dans la partie élémentaire de ces jeux de code mainframe. Les modifications détaillées sont décrites dans les fichiers MFConvChanges.jips, MFConvChanges.keis et MFConvChanges.jef, situés dans le répertoire /usr/share/doc.

En outre, cette version des méthodes de conversion iconv mainframe inclut un correctif qui permet de gérer une séquence de touches majucule incomplète à la fin d'un tampon d'entrée.

Impact sur le client

Si le client a déjà utilisé la version HP-UX 11iv1 des convertisseurs iconv mainframe et qu'il utilise ensuite cette version, les résultats seront différents en raison des correctifs apportés aux mappages des caractères standard JIS. Il est recommandé d'enregistrer et de renommer les tables précédemment installées avant de procéder à l'installation de cette version. Les données persistentes peuvent ensuite être reconverties à l'aide de l'ancienne table, puis reconverties en présentation correcte à l'aide des nouvelles tables.

Si le dernier caractère du tampon d'entrée peut être un caractère valide OU une séquence de touches majucule incomplète, iconv(3C) retourne EINVAL. Si ce caractère est le dernier du fichier d'entrée, iconv(3C) ne retourne jamais avec succès sans ajouter à ce caractère d'autres données fictives telles que NULL. Ce caractère est 0x1a pour jipsj, 0x3f pour jipsec/jipsek et 0xa pour keis7c/keis7k/keis8c/keis8k, qui pourrait être un caractère de contrôle OU une séquence de touches majucule incomplète.

Compatibilité

Aucun problème de compatibilité n'est attendu. Toutefois, en cas d'inquiétude concernant la compatibilité des données persistentes stockées sur un système HP-UX, il est recommandé d'enregistrer et de renommer les tables précédemment installées avant de procéder à l'installation de cette version. Les données persistentes peuvent ensuite être reconverties à l'aide de cette ancienne table, puis reconverties en présentation correcte à l'aide des nouvelles tables.

Performances

Aucun problème de performances.

Documentation

  • Manuel d'utilisation de l'environnement système japonais (disponible en langue japonaise uniquement)

  • Page de manuel iconv(3C)

Prévisions pour l'avenir

Les convertisseurs iconv mainframe respecteront les modifications futures apportées à la prise en charge de la norme Unicode dans HP-UX.

Version imprimable
Respect de la vie privée L'utilisation de ce site implique que vous en acceptez les conditions
© 2001-2003, 2005 Hewlett-Packard Development Company, L.P.