Bộ phần mềm xử lý văn bản tiếng Việt sẽ được công bố trong tháng 7

 

 “Ai cũng biết lỗi chính tả hiện nay rất trầm trọng. Ai cũng nói tiếng Việt đang bị loạn. Đều chỉ là nói chung chung. Ai cũng tin rằng mình không thể sai chính tả. Thực tế thì hầu hết đều sai. Tôi muốn đưa ra những con số cụ thể để sự cảnh báo trở nên xác đáng hơn”- TS Nguyễn Ái Việt nói.

 

Tiến sĩ Nguyễn Ái Việt- tác giả
bộ Công cụ Việt
Tiến sĩ Nguyễn Ái Việt- tác giả bộ Công cụ Việt . Ảnh: ĐH

Một công trình Xếp hạng văn bản tiếng Việt sẽ được công bố trong tháng 7. Tác giả là nhà vật lý, chuyên gia công nghệ thông tin –  tiến sĩ Nguyễn Ái Việt. Sáu năm trước, ông từ bỏ vị trí kỹ sư trưởng với mức lương 6 con số một năm tại tập đoàn Siemens (Mỹ) để trở về Việt Nam (VN).

“Chúng tôi thực hiện rà soát lỗi chính tả trên hệ thống văn bản của 200 đơn vị. Kết quả khá bất ngờ và choáng váng. Nơi sai nhiều nhất lại rơi vào một bộ quan trọng bậc nhất. Báo chí cũng sai khá trầm trọng, có những tờ báo sai trên 20%”, tiến sĩ Việt nói.

Công trình đặc biệt này thực hiện bởi bộ sản phẩm Công cụ Việt- chương trình phần mềm xử lý tiếng Việt được ông Việt và các cộng sự sáng tạo và hoàn thiện trong suốt ba năm qua.

Ý tưởng làm một bộ công cụ hỗ trợ việc đọc và viết tiếng Việt được tiến sĩ Nguyễn Ái Việt ấp ủ từ gần 20 năm trước. “Năm 1991, gia đình tôi chuyển từ Hungari sang Mỹ. Ở đấy, tiếng Việt đang dần xa lạ với các thế hệ Việt kiều trẻ. Vì thế mà cảm thấy xa lạ với quê hương. Tôi chợt nghĩ nếu có một công cụ gì đó giúp bà con đọc, viết và dịch tiếng Việt đúng và thuận tiện thì thật là hay”.

Tiến sĩ Việt là con trai nhà văn Huy Phương. Từ bé, tiếng Việt là niềm say mê của ông, mê đến nỗi nhiều lần bị bạn gái giận vì liên tục sửa lỗi ngôn từ của nàng và mọi người xung quanh.

Hai con ông, một rời Việt Nam khi mới 2 tuổi, một sinh ra ở nước ngoài đều nói tiếng Việt chuẩn như người sống trong nước.

Công cụ Việt là bộ phần mềm xử lý văn bản tiếng Việt, gồm 4 phần mềm tích hợp: Bút đỏ, Cờ lau, Từ điển Việt và sử dụng word 2007.

Bút đỏ giúp sửa lỗi phông chữ, chính tả, ngữ pháp và văn phong cho văn bản. Bút đỏ có thể đưa ra các từ gợi ý thông minh cho người sử dụng.

Cờ lau là công cụ tự động phát hiện các mã phông khác nhau trong văn bản và chuyển toàn bộ về Unicode (mã tiêu chuẩn quốc gia) một cách chính xác.

Từ điển Việt giúp người sử dụng tra cứu nghĩa chính xác của các từ và chọn từ tốt nhất trong quá trình soạn thảo văn bản.  

“Con cái của bạn bè tôi ở bên kia rất ngại về Việt Nam vì không nói được tiếng Việt, không thể giao tiếp với ông bà, họ hàng. Thành ra rất xa lạ với quê hương. Gia đình tôi qui ước chỉ nói chuyện bằng tiếng Việt và luôn nhắc các cháu về nguồn gốc gia đình”- bà Lê Ngọc Hồng, vợ ông Việt chia sẻ.

Được mời sang Mỹ với tư cách nhà vật lý nhưng sau một năm, tiến sĩ Việt mày mò tìm hiểu về máy tính. “Lúc đó chỉ nghĩ đơn giản là tìm thêm một công việc để kiếm ra tiền khi trở về Việt Nam, bên cạnh việc nghiên cứu vật lý”- ông Việt kể.

Công nghệ phần mềm đã mở ra cho tiến sĩ Việt chìa khóa để thực hiện ý tưởng về công cụ hỗ trợ tiếng Việt cho Việt kiều ở Mỹ, đồng thời mang lại những cơ hội làm việc tại các công ty lớn. Ông trở thành kỹ sư trưởng của Siemens với mức lương lên tới 6 con số, cùng nhà cửa và cuộc sống ổn định. Năm 2004, ông nhận lời mời trở về Việt Nam làm việc tại Bộ Bưu chính Viễn thông, từ bỏ mức lương cao ngất ở Mỹ.

Năm 2007, tiến sĩ Việt mới chính thức bắt tay thực hiện ý tưởng của 16 năm trước: “Không chỉ hỗ trợ Việt kiều, ngay cả người dân trong nước cũng cần được hỗ trợ để viết tiếng Việt cho chuẩn”. Ông cùng các cộng sự mất 8 tháng để cho ra sản phẩm đầu tiên, thêm một năm để hoàn thiện và bắt đầu cho thị trường dùng thử.

Hiện ông tiếp tục bắt tay vào làm bộ công cụ dịch thuật Anh- Việt, Việt- Anh với mong muốn giúp cho sự giao lưu giữa người Việt ở trong nước và Việt kiều được dễ dàng hơn.

Tiến sĩ Nguyễn Ái Việt hy vọng, khi bảng Xếp hạng văn bản của ông được công bố, mọi người sẽ có ý thức rõ hơn về những sai sót chính tả.

(Theo Tiền Phong)