UTF-8

From Wikipedia, the free encyclopedia

UTF-8
Remove ads

UTF-8 — elektronik kommunikasiya üçün istifadə olunan dəyişən uzunluqlu simvol kodlaşdırma standartı. Unicode Standartı tərəfindən müəyyən edilmiş ad Unicode (və ya Universal Kodlu Simvol Dəsti) Transformasiya Formatından – 8 bitdən götürülüb.[1]

Thumb
UTF-8 kodlaşdırmasının ətraflı sxemi. Bitlərin nömrələnməsi və hər bitin dəqiq mövqeyi daxildir.

UTF-8 Unicode-da birdən dördə qədər bir baytlıq (8-bit) kod vahidlərindən istifadə edərək bütün 1,112,064 etibarlı simvol kodu nöqtələrini kodlamağa qadirdir. Daha tez-tez baş verən daha aşağı ədədi dəyərlərə malik kod nöqtələri daha az baytdan istifadə etməklə kodlanır. ASCII ilə əvvəlki versiyalara uyğunluq üçün hazırlanmışdır. ASCII-yə bir-bir uyğun gələn ilk 128 Unicode simvolu, ASCII ilə eyni ikili dəyəri olan bir bayt istifadə edərək kodlanır, beləliklə etibarlı ASCII mətni də UTF-8 kodlu Unicode mətnidir.

UTF-8 qismən ASCII uyğunluğu ilə təklif olunan dəyişən uzunluqlu kodlaşdırma olan UTF-1-in üstün alternativi olaraq hazırlanmışdır. Bu kodlaşdırmada bəzi xüsusiyyətlər, o cümlədən özünü sinxronizasiya və drop (/) kimi simvolların tam ASCII-yə uyğun işləməsi yoxdur. Ken TompsonRob Payk 1992-ci ilin sentyabrında Plan 9 əməliyyat sistemi üçün ilk tətbiqi yayımladılar.[2][3] Bu, ilk dəfə 1993-cü ilin yanvarında USENIX-də rəsmi olaraq elan olunan və internet standartları üzrə gələcək iş üçün RFC 2277-də (BCP 18) IETF tərəfindən qəbul edilən FSS-UTF üçün bir spesifikasiya olaraq X/Open tərəfindən qəbul edilməsinə səbəb oldu.[4][5][6]

UTF-8 istənilən alternativ mətn kodlaşdırmasına nisbətən daha az beynəlmiləlləşdirmə[7][8] problemi ilə nəticələnir. UTF-8 bütün müasir əməliyyat sistemlərində, o cümlədən Microsoft WindowsJSON kimi standartlarda tətbiq edilmişdir,o burada Unicode-un icazə verilən yeganə formasıdır.

UTF-8 World Wide Web (və internet texnologiyaları) üçün dominant kodlaşdırmadır və 2023-cü ilə qədər bütün veb səhifələrin 98%-ni, ilk 10,000 səhifənin 99,1%-ni və bir çox dillər üçün 100%-ə qədərini təşkil edir. Faktiki olaraq bütün ölkələr və dillər internetdə UTF-8 kodlaşdırmalarından 95% və ya daha çox istifadə edir.[9]

Remove ads

Həmçinin bax

  • Alt code
  • E-poçt proqramlarının müqayisəsi
  • Unicode kodlaşdırmalarının müqayisəsi
    • GB 18030
    • UTF-EBCDIC
  • Iconv
  • Faiz kodlaşdırması
  • Specials (Unicode bloku)
  • Unicode və e-poçt
  • Unicode və HTML
    • HTML-də simvol kodlaşdırılmaları

İstinadlar

Xarici keçidlər

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads