6172009 - PowerPoint PPT Presentation

1 / 19
About This Presentation
Title:

6172009

Description:

Th?ng nh?t m?t c ch bi?u di?n gi tr? byte cho m?i ho?t d?ng x? l , luu tr?, ... M?t m?t, Unicode th?ng nh?t quan ni?m m?i k t? du?c d?t tuong ?ng v?i m?t v ... – PowerPoint PPT presentation

Number of Views:190
Avg rating:3.0/5.0
Slides: 20
Provided by: downloadM
Category:
Tags: thong

less

Transcript and Presenter's Notes

Title: 6172009


1
Unicode và phát tri?n ph?n m?m
  • Ngô Trung Vi?t
  • Vi?n Công ngh? Thông tin
  • vietnt_at_itprog.gov.vn

2
N?i dung
  • T? b? mã ASCII t?i b? kí t? da ng? qu?c t?
    Unicode
  • Ki?n trúc Unicode
  • Khái ni?m kí t?
  • Cài d?t Unicode
  • Unicode và phát tri?n ph?n m?m

3
1.1 Ð?c di?m c?a b? mã ASCII
  • Ðu?c thi?t k? d? mã hoá cho ti?ng Anh không gian
    mã hoá 7-bit là d?.
  • 2 d?ng chính bi?u di?n kí t?
  • bi?u di?n giá tr? s? cho máy tính mã (code)
  • bi?u di?n d? ho? cho con ngu?i hình ch? (glyph)
  • Th?ng nh?t m?t d?ng bi?u di?n s? trong máy tính
    cho x? lí, luu tr?, truy?n thông

4
B? mã ASCII 7-bit
5
Ð?c di?m c?a ASCII 8-bit
  • Kí t? có hình ch? du?c xác d?nh trong t?p font
    ch?.
  • Kí t? du?c bi?u di?n b?ng m?t giá tr? s? (0-255).
  • Giá tr? s? du?c bi?u di?n b?ng 1 byte trong b?
    nh?.
  • Th?ng nh?t m?t cách bi?u di?n giá tr? byte cho
    m?i ho?t d?ng x? lí, luu tr?, truy?n thông các kí
    t?.
  • T?p các giá tr? mã c? d?nh (0-255) du?c d?t tuong
    ?ng v?i nhi?u t?p kí t? khác nhau c?a các nu?c
    (b?i t?i t?p mã).
  • Phát sinh khái ni?m trang mã cho t?ng nu?c.

6
Mã s? là trung tâm trong ASCII
hình ch? - kí t?
Con ngu?i
bi?u di?n trong 1 byte
Máy móc
7
Kí t? là trung tâm trong Unicode
Con ngu?i
Các kí t? tuong duong
hình ch?
M?c ngôn ng?
di?m mã
M?c bi?u di?n trong máy
Ki thu?t cài d?t
Máy móc
8
Nguyên t?c xây d?ng b? kí t? Unicode
  • L?a ch?n các kí t? dua vào t?p kí t? da ng? (d?m
    b?o không trùng hình)
  • Ð?t mã s? duy nh?t (di?m mã) cho các kí t?
  • Xác d?nh các qui t?c bi?u di?n tuong duong kí t?
    (v? m?t ngôn ng?), n?u có
  • Xác d?nh các cách bi?u di?n tu?n t? theo các byte
    (trong máy tính) cho di?m mã

9
Ki?n trúc mã hoá kí t? Unicode
  • Unicode d? d?nh dùng không gian mã hoá 16 bit,
    nhung không d? ch?, sau dó dùng không gian mã hoá
    21 bit, cho phép mã hoá t?i trên 1 tri?u kí t?.
  • Co ch? dánh mã cho các kí t? ? ngoài vùng BMP, có
    tên là ki thu?t thay th? (surrogate), dùng hai
    ch? s? 16-bit d? tính toán t?o ra d?a ch? mã hoá
    th?c c?a kí t?.
  • Th?c t? ki?n trúc c?a Unicode có 17 m?t ph?ng,
    m?i m?t ph?ng ch?a 65 535 di?m mã

10
Các m?t ph?ng dã c?p mã
11

12
Trích t? "3.7 Surrogates"
  • High-surrogate H, t? UD800 t?i
    UDBFFLow-surrogate L, t? UDC00 t?i UDFFF
  • C?p
  • Giá tr? vô hu?ng Unicode N, gi?a 0 --
    10FFFF16(t?i da 21 bits 17 M?t ph?ng 1tri?u
    kí t?)
  • N (H - D80016) 40016 (L - DC0016) 1000016
  • H (N - 1000016) / 40016 D80016L (N -
    1000016) 40016 DC0016

13
Trích t? "3.7 Surrogates"
  • High- (H) and low-surrogates (L) không có di?n
    gi?i n?u chúng không xu?t hi?n nhu m?t c?p thay
    th?.
  • C?p thay th? () du?c thi?t k? d? cho phép
    bi?u di?n các kí t? trong các m? r?ng tuong lai
    c?a Unicode.
  • Giá tr? vô hu?ng Unicode (N) du?c xác d?nh d?
    dùng trong các chu?n nhu SGML, XML, HTML, , dòi
    h?i m?t giá tr? vô hu?ng liên k?t v?i m?t kí t?
    tr?u tu?ng.

14
"ba" ?
15
? theo công th?c surrogate
  • N 2002716 0 0010 0000 0000 0010 01112
    13111110
  • N - 1000016 0001 0000 0000 0010 01112
  • H 00 0100 00002 D80016 D84016 5536010
  • L 00 0010 01112 DC0016 DC2716 5635910
  • Ví d?
  • HTML " 131111 "
  • TrueType gsub table 131111.

16
Khái ni?m kí t?
  • Kí t? chúng ta thu?ng hi?u là hình v? d? ho? nào
    dó bi?u di?n cho m?t thành t? ngôn ng? và du?c
    bi?u di?n trong máy b?ng m?t con s?.
  • Kí t? trong tin h?c bây gi? du?c hi?u là m?t khái
    ni?m tr?u tu?ng, có tên riêng, có hình d?ng th?
    hi?n d? ho? qua phông ch?, nhung l?i có th? có
    nhi?u d?ng bi?u di?n khác nhau tu? theo ngôn ng?
    và máy tính.

17
Khái ni?m kí t? (ti?p)
  • M?t m?t, Unicode th?ng nh?t quan ni?m m?i kí t?
    du?c d?t tuong ?ng v?i m?t và ch? m?t giá tr? s?
    duy nh?t du?c g?i là di?m mã.
  • Nhung m?t khác, Unicode ch?p nh?n cài d?t cho d?c
    trung c?a các ngôn ng? th?c t?, m?i kí t? có th?
    du?c bi?u di?n b?ng m?t dãy các kí t?, và d?c
    trung c?a các máy tính, m?i di?m mã du?c bi?u
    di?n b?ng nhi?u ki?n trúc tu?n t?.

18
Ngôn ng?
Bi?u di?n byte trong máy
Con ngu?i
Ð?nh d?ng chuy?n d?i Unicode UTF-8, UTF-16,
UTF-32
19
Khái ni?m kí t? (ti?p)
  • Unicode không có mã t? h?p hay mã d?ng s?n, ch?
    có kí t? t? h?p hay kí t? d?ng s?n.
  • Unicode là duy nh?t theo nghia m?i kí t? d?ng s?n
    có m?t di?m mã duy nh?t.
  • Unicode ch?p nh?n nhi?u m?c d? cài d?t. M?c d?
    cài d?t th? nh?t là là cài d?t kí t? d?ng s?n
    không có kí t? t? h?p. Các m?c cài d?t sau ch?p
    nh?n cách t? h?p kí t?.

20
Khái ni?m kí t? (ti?p)
  • Unicode d?nh nghia ra nhi?u d?nh d?ng bi?n d?i
    Unicode (Unicode Transformation Format - UTF) d?
    bi?u di?n các giá tr? di?m mã c? d?nh c?a Unicode
    trong các máy tính.
  • Các UTF UTF-8, UTF-16, UTF-32 d? ngu?i cài d?t
    có th? tu? môi tru?ng c?a mình mà s? d?ng

21
D?ng bi?u di?n kí t? Vi?t
  • Tu? nhà s?n xu?t s? d?ng cách bi?u di?n kí t?
    Vi?t theo d?ng s?n hay t? h?p trong ki?n trúc x?
    lí bên trong c?a mình, mi?n là tuân th? Unicode.
  • Tuy nhiên yêu c?u c?a ngu?i dùng c?n du?c tuân
    th? là d?ng hi?n th? dua ra là d?ng s?n.
  • C?n có các b? l?c chuy?n d?i sang các d?ng bi?u
    di?n d?ng s?n và t? h?p d?i v?i ph?n m?m.

22
Cài d?t Unicode
  • Ki thu?t dua vào t? bàn phím
  • Ki thu?t hi?n th? và in ?n
  • Các ki thu?t cài d?t và x? lí kí t? t? h?p
  • Các ki thu?t x? lí van b?n da ng? (d?nh biên t?,
    dòng, kh?i)
  • S?p x?p theo các van hoá, tìm duy?t

23
Unicode và phát tri?n ph?n m?m
  • Qu?c t? hoá ph?n m?m, x? lí thông tin theo góc d?
    m?i ngôn ng? ph?i d?a trên Unicode.
  • Chuy?n t? thói quen x? lí t?p kí t? tuong ?ng m?t
    byte cho m?i kí t? (SBCS single byte per
    character set) sang x? lí t? h?p kí t?, nhi?u
    d?ng bi?u di?n kí t?.
Write a Comment
User Comments (0)
About PowerShow.com