Normalisation Unicode

De Wikipédia, l'encyclopédie libre

La normalisation Unicode est une normalisation de texte qui transforme des caractères ou séquences de caractères équivalents en représentation fondamentale afin que celle-ci puisse être facilement comparée.

La décomposition canonique peut être utilisée dans l’échange normalisé de textes. Elle permet d’effectuer une comparaison binaire tout en conservant une équivalence canonique avec le texte non normalisé d’origine.

NFD

Les caractères sont décomposés par équivalence canonique et réordonnés.

Davantage d’informations chaîne, caractères ...
Exemples NFD
chaînecaractères caractères
normalisés
chaîne
normalisée
À AU+0041 + ̀U+0300 = AU+0041 + ̀U+0300 À
ẹ́ eU+0065 + ́U+0301 + ̣U+0323 eU+0065 + ̣U+0323 + ́U+0301 ẹ́
ñ ñU+00F1 nU+006E + ̃U+0303 ñ
(ohm) U+2126 ΩU+03A9 Ω (oméga)
fi (ligature) U+FB01 = U+FB01 fi (ligature)
² (exposant) ²U+00B2 = ²U+00B2 ² (exposant)
U+D55C U+1112 + U+1161 + U+11AB
U+304B + U+3099 = U+304B + U+3099
ئ ئU+0626 يU+064A + ٔU+0654 ئ
בּ U+FB31 בU+05D1 + ּU+05BC בּ
Fermer

NFC

Les caractères sont décomposés par équivalence canonique, réordonnés, et composés par équivalence canonique.

Davantage d’informations chaîne, caractères ...
Exemples NFC
chaînecaractères caractères
normalisés
chaîne
normalisée
À AU+0041 + ̀U+0300 ÀU+00C0 À
ẹ́ eU+0065 + ́U+0301 + ̣U+0323 U+1EB9 + ́U+0301 ẹ́
ñ ñU+00F1 = ñU+00F1 ñ
(ohm) U+2126 ΩU+03A9 Ω (oméga)
fi (ligature) U+FB01 = U+FB01 fi (ligature)
² (exposant) ²U+00B2 = ²U+00B2 ² (exposant)
U+D55C = U+D55C
U+304B + U+3099 U+304C
ئ ئU+0626 = ئU+0626 ئ
בּ U+FB31 בU+05D1 + ּU+05BC בּ
Fermer

NFKD

Les caractères sont décomposés par équivalence canonique et de compatibilité, et sont réordonnés.

Davantage d’informations chaîne, caractères ...
Exemples NFKD
chaînecaractères caractères
normalisés
chaîne
normalisée
À AU+0041 + ̀U+0300 = AU+0041 + ̀U+0300 À
ẹ́ eU+0065 + ́U+0301 + ̣U+0323 eU+0065 + ̣U+0323 + ́U+0301 ẹ́
ñ ñU+00F1 nU+006E + ̃U+0303 ñ
(ohm) U+2126 ΩU+03A9 Ω (oméga)
fi (ligature) U+FB01 fU+0066 + iU+0069 fi
² (exposant) ²U+00B2 2U+0032 2
U+D55C U+1112 + U+1161 + U+11AB
U+304B + U+3099 = U+304B + U+3099
ئ ئU+0626 يU+064A + ٔU+0654 ئ
בּ U+FB31 בU+05D1 + ּU+05BC בּ
Fermer

NFKC

Les caractères sont décomposés par équivalence canonique et de compatibilité, sont réordonnés et sont composés par équivalence canonique.

Davantage d’informations chaîne, caractères ...
Exemples NFKC
chaînecaractères caractères
normalisés
chaîne
normalisée
À AU+0041 + ̀U+0300 ÀU+00C0 À
ẹ́ eU+0065 + ́U+0301 + ̣U+0323 U+1EB9 + ́U+0301 ẹ́
ñ ñU+00F1 = ñU+00F1 ñ
(ohm) U+2126 ΩU+03A9 Ω (oméga)
fi (ligature) U+FB01 fU+0066 + iU+0069 fi
² (exposant) ²U+00B2 2U+0032 2
U+D55C = U+D55C
U+304B + U+3099 U+304C
ئ ئU+0626 = ئU+0626 ئ
בּ U+FB31 בU+05D1 + ּU+05BC בּ
Fermer

Annexes

Articles connexes

  • Unicode
  • Équivalence Unicode
  • L’outil uconv (ICU) permet de normaliser du texte, par exemple « uconv -x '::nfkd;' » applique la normalisation NFKD.

Liens externes

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.