Font chữ tiếng Việt:
Ðể hiển thị tiếng Việt Unicode cần phải cài đặt font chữ Unicode, chỉ cần cài 1 trong các phần mềm sau: Internet Explore 5 trở lên hoặc MS Office 2000, 2003 hoặc cài đặt Windows 2000/XP. Khi cài đặt 1 trong những phần mềm trên các font Unicode có tiếng Việt sẽ được tự động cài đặt hệ thống. Các font cơ bản của Microsoft đi kèm với các phần mềm trên đã hỗ trợ tiếng Việt Unicode là Times New Roman, Arial, Courier, Tahoma. Ngoài ra có thể tải xuống các font Unicode (có hỗ trợ tiếng Việt) khác trên Internet: Verdana, Arial Narrow, Arial Black, Bookman Old Style, Garamond, Impact, Lucida Sans, Comic Sans…
Giao diện bộ gõ Unikey. |
Unicode là bộ mã ký tự 16-bit, tương thích hoàn toàn với chuẩn quốc tế ISO/IEC 10646-1; 1993. Với 65,536 ký tự, Unicode hầu như có thể mã hóa tất cả các ngôn ngữ trên thế giới. Chuẩn Unicode mô tả các ký tự ngôn ngữ, các dấu chấm câu, dấu phụ, ý hiệu toán học, các dấu mũi tên và các ký hiệu Dingbats. Unicode và ISO-10646 quy định 2 cơ chế, khuôn dạng chuyển đổi là UTF-8 và UTF-16.
Mỗi ký tự trong bảng mã Unicode đều có độ dài cố định là 16 Bit, nhờ đó việc xử lý các xâu ký tự Unicode rất đơn giản không phức tạp như các giải pháp dùng chuỗi ký tự điều khiển, phải có những thuật toán tương đối phức tạp để nhận diện ký tự trong 1 chuỗi các Byte. Trong khi đó với Unicode mỗi ký tự có độ dài đúng 2 Byte nên có thể định vị rất dễ dàng các vị trí của ký tự trong chuỗi Byte cho trước.
Unicode đã được cài đặt trong các hệ điều hành Windows NT, Windows XP, Macintosh (Mac OS 8+), Linux… Muốn sử dụng Unicode cần phải có những phần mềm hỗ trợ hiển thị hoặc cho phép gõ ký tự theo chuẩn Unicode, ngoài ra cũng cần phải có Font chữ Unicode được cài đặt trong hệ thống.
Tiếng Việt được xếp vào họ La-tinh mở rộng 1 (Latinh Extended 1), tuy rằng các ký tự Việt phân bố không tập trung, nhưng có 1 thuận lợi rất lớn là do tiếng Việt được xếp vào họ La-tinh nên đây là thành phần cơ bản của hầu hết tất cả các font chữ Unicode. Có nghĩa là tiếng Việt có mặt ở mọi nơi trong bất kỳ của ngôn ngữ nào, và như thế có thể đọc được tiếng Việt ở mọi nơi có cài đặt font Unicode. Trong khi đó các ngôn ngữ không thuộc họ la-tinh như China, Japan, Lao, Thai…thì không phải lúc nào cũng có sẵn trong các font Unicode.
Tiếng Việt trong Unicode có thể có 2 dạng: ký tự dựng sẵn và ký tự tổ hợp. Unicode có đủ 134 ký tự cho tất cả chữ hoa và chữ thường trong bảng chữ cái tiếng Việt, đồng thời có mã cho 5 dấu thanh (Huyền, sắc, hỏi, ngã, nặng) để tạo ra các ký tự Việt dạng tổ hợp, ngoài ra Unicode còn có dấu riêng để biểu diễn đơn vị tiền đồng Việt nam.
Ví dụ: Chữ c ả n g sẽ được biểu diễn dưới dạng Unicode như sau (Chuỗi số Hex):
0063 1EA3 006E 0067 (mã dựng sẵn)
0063 0041 0309 006E 0067 (mã tổ hợp)
– Unicode Dựng sẵn: coi tập hợp chữ + dấu mũ + dấu thanh như một ký tự duy nhất.
Chữ “Việt” gồm 4 ký tự V, i, ệ, t
– Unicode Tổ hợp: coi tập hợp chữ + dấu mũ như một ký tự duy nhất, dấu thanh được tính là một ký tự riêng
Chữ “Việt” gồm 5 ký tự V, i, ê, t và dấu nặng
Unicode dựng sẵn đang được sử dụng rộng rãi trên khắp các website Việt Nam mặc dù Microsoft vẫn tiếp tục phát triển Unicode tổ hợp vì trước đây “đại gia” này hỗ trợ tiếng Việt 8-bit theo kiểu tổ hợp.
Để biết thêm cụ thể về Unicode và các dạng của nó, bạn có thể tham khảo các bài viết trên báo PCWorld và tại Undp.org.vn.
Chuyển đổi bảng mã với Unikey. |
Chương trình bàn phím tiếng Việt:
Unikey đang là chương trình gõ tiếng Việt phổ biến nhất vì tính gọn nhẹ, dễ dùng và chạy trong tất cả các Windows 32-bit. Unikey cũng là phần mềm miễn phí, mã nguồn mở theo GNU.
UniKey hỗ trợ:
– Nhiều bảng tiếng Việt thông dụng: Unicode tổ hợp và dựng sẵn, TCVN3 (ABC), BK HCM1, BK HCM2, Vietware-X, Vietware-F, VIQR, VNI, VPS, VISCII, Unicode encodings: UTF-8, NCR Decimal/Hexadecimal – dùng cho Web, Windows 1258 code page (chuẩn tiếng Việt của Microsoft).
– 3 phương pháp gõ thông dụng nhất: TELEX, VNI và VIQR.
– Chuyển đổi giữa các bảng mã tiếng Việt.
– Tất cả các phiên bản Windows 32 bit: Windows 9x/ME, Windows NT/2000/XP.
– UniKey chỉ có kích thước nhỏ và không yêu cầu thêm bất cứ thư viện nào khác.
– UniKey có thể chạy mà không cần cài đặt.
Sau khi tải về Unikey 4.0 tại đây theo dạng đóng gói cài đặt, tiến hành cài đặt vào hệ thống. Sau đó, trên khay hệ thống sẽ xuất hiện biểu tượng Unikey (chữ V là đang ở trạng thái gõ tiếng Việt, chữ E là không dấu – English). Bạn phải chuột vào biểu tượng Unikey, chọn kiểu gõ là “VNI” hay “Telex” tùy ý, bảng mã là “Unicode dựng sẵn” rồi tiến hành soạn thảo văn bản tiếng Việt trong Microsoft Word hay bất kỳ trình soạn thảo văn bản nào khác. Lưu ý là bạn phải chọn font Unicode phù hợp như Arial, Times New Roman …