Dãy Unicode

From Wikipedia, the free encyclopedia

Remove ads
Remove ads

Trong Unicode một khối hay dãy được định nghĩa là một phạm vi hay vùng các điểm mã liền kề. Các dãy được đặt tên duy nhất và không có sự chồng chéo với nhau. Chúng có điểm mã bắt đầu có dạng hhh0điểm mã kết thúc thường có dạng hhhF.

Một khối đã định nghĩa có thể bao gồm các điểm mã không được gán với ký tự nào [1]. Còn điểm mã không thuộc về bất kỳ khối nào được đặt tên, ví dụ trong đoạn chưa được gán 3-13, có khối giá trị là "No_block".

Ngược lại, mọi điểm mã (hay vị trí mã) được gán đều có thuộc tính "Tên khối", xác định khối duy nhất chứa ký tự. Điều này chỉ được xác định bởi điểm mã, mặc dù tên khối sẽ có tính chất mô tả, ví dụ khối "Tây Tạng" (Tibetan) hoặc "Supplemental Arrows-A".

Các phân khu, chẳng hạn như các "Biểu tượng quân cờ" (Chess symbols) trong khối Biểu tượng khác (Miscellaneous symbols), không phải là "khối". Tên nhóm con chỉ là một bổ sung biên tập thông tin.

Số lượng điểm mã trong một khối Unicode được chọn là bội số của 16. Khối Unicode có kích thước từ tối thiểu 16 đến tối đa 65.536 điểm mã.

Unicode 12.0 định nghĩa 300 khối [2]:

  • 163 trong mặt (plane) 0, mặt đa ngữ cơ bản (BMP, Basic Multilingual Plane)
  • 127 trong mặt 1, mặt đa ngữ bổ sung (SMP, Supplementary Multilingual Plane)
  • 6 trong mặt 2, mặt tượng hình bổ sung (SIP, Supplementary Ideographic Plane)
  • 2 trong mặt 14 (Ehex), mặt mục đích đặc biệt bổ sung (SSP, Supplementary Special-purpose Plane)
  • Một trong mỗi mặt 5 (Fhex) và 16 (10hex), được gọi là Khu vực sử dụng riêng bổ sung-A và -B (Supplementary Private Use Area-A and -B)
Thêm thông tin Mặt, Phạm vi khối ...
Remove ads

Tham khảo

Loading content...

Liên kết ngoài

Loading content...
Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads