UTF-8
From Wikipedia, the free encyclopedia
Remove ads
UTF-8 — elektronik kommunikasiya üçün istifadə olunan dəyişən uzunluqlu simvol kodlaşdırma standartı. Unicode Standartı tərəfindən müəyyən edilmiş ad Unicode (və ya Universal Kodlu Simvol Dəsti) Transformasiya Formatından – 8 bitdən götürülüb.[1]

UTF-8 Unicode-da birdən dördə qədər bir baytlıq (8-bit) kod vahidlərindən istifadə edərək bütün 1,112,064 etibarlı simvol kodu nöqtələrini kodlamağa qadirdir. Daha tez-tez baş verən daha aşağı ədədi dəyərlərə malik kod nöqtələri daha az baytdan istifadə etməklə kodlanır. ASCII ilə əvvəlki versiyalara uyğunluq üçün hazırlanmışdır. ASCII-yə bir-bir uyğun gələn ilk 128 Unicode simvolu, ASCII ilə eyni ikili dəyəri olan bir bayt istifadə edərək kodlanır, beləliklə etibarlı ASCII mətni də UTF-8 kodlu Unicode mətnidir.
UTF-8 qismən ASCII uyğunluğu ilə təklif olunan dəyişən uzunluqlu kodlaşdırma olan UTF-1-in üstün alternativi olaraq hazırlanmışdır. Bu kodlaşdırmada bəzi xüsusiyyətlər, o cümlədən özünü sinxronizasiya və drop (/) kimi simvolların tam ASCII-yə uyğun işləməsi yoxdur. Ken Tompson və Rob Payk 1992-ci ilin sentyabrında Plan 9 əməliyyat sistemi üçün ilk tətbiqi yayımladılar.[2][3] Bu, ilk dəfə 1993-cü ilin yanvarında USENIX-də rəsmi olaraq elan olunan və internet standartları üzrə gələcək iş üçün RFC 2277-də (BCP 18) IETF tərəfindən qəbul edilən FSS-UTF üçün bir spesifikasiya olaraq X/Open tərəfindən qəbul edilməsinə səbəb oldu.[4][5][6]
UTF-8 istənilən alternativ mətn kodlaşdırmasına nisbətən daha az beynəlmiləlləşdirmə[7][8] problemi ilə nəticələnir. UTF-8 bütün müasir əməliyyat sistemlərində, o cümlədən Microsoft Windows və JSON kimi standartlarda tətbiq edilmişdir,o burada Unicode-un icazə verilən yeganə formasıdır.
UTF-8 World Wide Web (və internet texnologiyaları) üçün dominant kodlaşdırmadır və 2023-cü ilə qədər bütün veb səhifələrin 98%-ni, ilk 10,000 səhifənin 99,1%-ni və bir çox dillər üçün 100%-ə qədərini təşkil edir. Faktiki olaraq bütün ölkələr və dillər internetdə UTF-8 kodlaşdırmalarından 95% və ya daha çox istifadə edir.[9]
Remove ads
Həmçinin bax
- Alt code
- E-poçt proqramlarının müqayisəsi
- Unicode kodlaşdırmalarının müqayisəsi
- GB 18030
- UTF-EBCDIC
- Iconv
- Faiz kodlaşdırması
- Specials (Unicode bloku)
- Unicode və e-poçt
- Unicode və HTML
- HTML-də simvol kodlaşdırılmaları
İstinadlar
Xarici keçidlər
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads
