A propos d'Unicode

4D - Documentation   Français   English   German   Español   4D v11 SQL, Commandes par thèmes   4D v11 SQL, Liste alphabétique des commandes   4D v11 SQL, Constantes par thèmes   Retour   Précédent   Suivant

version 11


Présentation

Dans les bases de données créées avec 4D v11, le langage ainsi que le moteur de la base de données stockent et manipulent nativement les caractères en Unicode.

Ce principe facilite l'internationalisation des applications 4D. L'Unicode un jeu de caractères standard unifié qui gère pratiquement toutes les langues usuelles de la planète. Un jeu de caractères est une table de correspondance caractère/valeur numérique, par exemple "a"->1, "b"->2, "5"->15, "oe"->662, etc. Alors qu'en ASCII la valeur numérique de base est typiquement comprise entre 1 et 127, en Unicode la borne haute va au-delà de 65000, ce qui permet de représenter quasiment tous les caractères de toutes les langues.

Il existe différentes manières de coder les valeurs numériques Unicode : UTF-16 les code sur des entiers de 16-bits, UTF-32 sur des entiers de 32-bits et UTF-8 sur des entiers de 8-bits. 4D utilise principalement UTF-16 (comme Windows et Mac OS). Parfois, essentiellement pour des besoins liés au Web, 4D utilise UTF-8 qui a l'avantage de la compacité et de la lisibilité pour les caractères usuels (a-z,0-9).

Attention : En unicode dans 4D v11, les codes de caractères suivants sont réservés et ne doivent jamais être inclus dans un texte:

0
65534 (FFFE)
65535 (FFFF)

Mode compatibilité ASCII

Les versions précédentes de 4D fonctionnaient avec la table ASCII étendue du Macintosh (cf. section Codes ASCII). Par défaut, les bases de données converties depuis une version précédente de 4D fonctionnent toujours dans ce mode, appelé "Mode compatibilité ASCII".

Il est possible d'appliquer le mode Unicode aux bases de données converties via le sélecteur Mode Unicode des commandes Lire parametre base et FIXER PARAMETRE BASE ou via l'option Mode Unicode placée dans la page Application/Compatibilité des Préférences :

Note : Le mode est spécifique à chaque base de données. Il est donc possible de faire cohabiter une base Unicode avec des composants non Unicode (ou inversement).

Dans la plupart des cas, le fonctionnement initial des applications n'est pas affecté par ce paramétrage, 4D se chargeant en interne des conversions de caractères nécessaires. En outre, les caractères les plus courants (a-z, 0-9, etc...) ont la même valeur (de 1 à 127) en Unicode et en ASCII (Windows et Mac OS).

Toutefois, certaines instructions du langage, utilisant notamment les commandes travaillant avec les chaînes de caractères, pourront nécessiter des adaptations. Par exemple, l'instruction Caractere(200) ne retournera pas la même valeur en Unicode et en ASCII. Ce manuel décrit les différences de fonctionnement entre le mode Unicode et le mode compatibilité ASCII pour chaque commande concernée.


4D - Documentation   Français   English   German   Español   4D v11 SQL, Commandes par thèmes   4D v11 SQL, Liste alphabétique des commandes   4D v11 SQL, Constantes par thèmes   Retour   Précédent   Suivant