“Dạy tiếng Việt” cho... máy tính

16/Thg3/2010 16:29:50

Xử lý ngôn ngữ tự nhiên (natural language processing - NLP) là một trong những lĩnh vực khó nhất của trí tuệ nhân tạo, tập trung vào các ứng dụng "dạy" máy tính hiểu được ý nghĩa và tương tác, giao tiếp bằng chính ngôn ngữ con người. Trong khi các nghiên cứu và ứng dụng NLP của nhiều nước trên thế giới đã có hơn nửa thế kỷ nhưng vẫn còn quá mới mẻ tại Việt Nam. Và "xử lý tiếng Việt" lại chỉ có thể do chính người Việt làm chứ không thể chuyển giao công nghệ từ nước ngoài. Điều ấy đã thúc đẩy Tiến sỹ Phan Thị Tươi lao vào nghiên cứu và bảo vệ thành công luận án tiến sỹ tại Trường ĐH Tổng hợp Tiệp Khắc (Karlova Universita) năm 1985 với đề tài "Giao tiếp với máy tính trên cơ sở dữ liệu bằng tiếng Việt". Niềm đam mê "Việt hóa" các tiện ích máy tính được cô truyền đến nhiều thế hệ sinh viên công nghệ thông tin Trường ĐH Bách khoa, hình thành "cái nôi NLP" với không ít tiến sỹ, thạc sỹ trưởng thành.

Vừa tham gia giảng dạy, vừa đảm trách vai trò lãnh đạo một trường đại học hàng đầu trong nước, Tiến sỹ Phan Thị Tươi vẫn không ngừng nghiên cứu chuyên sâu các ứng dụng NLP. Từ năm 1993 đến nay, cô là chủ nhiệm của 9 đề tài khoa học được nghiệm thu với kết quả đánh giá cao: Tạo bộ sinh tự động phân tích từ vựng, cú pháp, ứng dụng dịch tự động Anh - Việt, Việt - Anh, trợ giúp truy xuất thông tin bằng tiếng Việt…

Điều đáng trân trọng là các công trình của cô tập trung nghiên cứu nền tảng, xây dựng "hạ tầng cơ sở" (cơ sở dữ liệu, kho ngữ liệu) vì mục tiêu phát triển lâu dài trong lĩnh vực NLP và chia sẻ mở rộng cho các nhóm nghiên cứu đi sau kế thừa, rút ngắn tiến độ và hoàn thiện bộ sản phẩm tốt hơn.

Hiện nay, nhóm nghiên cứu của cô đang tham gia nghiên cứu đề tài khoa học cấp Nhà nước "Nghiên cứu, xây dựng một số hệ thống khai thác thông tin đa phương tiện có hỗ trợ tiếng Việt". Hệ thống hỏi đáp này có khả năng tìm kiếm thông tin trong các nguồn cơ sở tri thức để trả lời yêu cầu của người sử dụng, tạo ra mô hình "tổng đài 1080 tự động", bỏ qua cách làm thủ công, cùng lúc có thể giải đáp hàng trăm ngàn câu hỏi.

Theo Hà Nội mới, 15/03/2010