Hội thảo Quốc gia 2005 Lần thứ X
MỘT SỐ VẤN ĐỀ CHỌN LỌC
CỦA CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
Chủ đề : Các Hệ thống Thông minh
Đại Lải, 14-15/09/2007
TÓM TẮT BÁO CÁO
PHÁT TRIỂN CÔNG CỤ TƯƠNG TÁC VỚI CÁC KHO NGỮ LIỆU NHỜ VĂN PHẠM TẠO SINH GIAO DIỆN
Phan Huy Khánh, Văn Thị Thu Hương,Thái Thu Hà, Lê Thị Thanh Thủy
Khoa Công nghệ Thông tin
Trường Đại học Bách khoa
Đại học Đà Nẵng
54, Nguyễn Lương Bằng, Hoà Khánh, Liên Chiểu, TP. Đà Nẵng
E-Mail. khanhph@vnn.vn, thaithuha@gmail.com,
vanhuongdn@gmail.com, thanhthuydn@gmail.com
Một trong những thao tác người ta thường hay gặp trong quá trình xử lý ngôn ngữ tự nhiên, đặc biệt là xử lý tiếng Việt, là phải xây dựng các công cụ truy cập đến các cơ sở dữ liệu (CSDL) từ vựng, gọi tắt là kho ngữ vựng. Thông qua giao diện của các công cụ đã được xây dựng này, người sử dụng (NSD) có thể xem nội dung, thống kê, tìm kiếm hay cập nhật dữ liệu... theo nhu cầu. Tuy nhiên, hiện nay, vẫn chưa có nhiều các kho ngữ liệu mẫu tiếng Việt có cấu trúc nhất quán, có nội dung phong phú, đa dụng và dễ dàng khai thác theo định hướng mã nguồn mở. Mặt khác, việc xây dựng các công cụ truy cập dữ liệu như vậy thường mất nhiều rất thời gian và công sức, khó trao đổi giữa các nhóm nghiên cứu với nhau, lại phụ thuộc đáng kể vào bản chất của các kho ngữ vựng. Từ nhu cầu thực tiễn trong việc triển khai các đề tài NCKH tại Trung tâm DATIC, khoa CNTT, Đại học Đà Nẵng, chúng tôi đã đề xuất giải pháp xây dựng một văn phạm được đặt tên là H2T cho phép lập trình tạo sinh các giao diện để từ đó, NSD có thể truy cập đến các kho ngữ vựng dạng XLM có cấu trúc nhất quán đã được định nghĩa trước. Văn phạm H2T áp dụng bộ phân tích cú pháp ANTLR (ANother Tool for Language Recognition) để sản sinh mã Java từ các chương trình giao diện của NSD. Ưu điểm của giải pháp là NSD hoàn toàn có thể xây dựng một không gian giao diện tuỳ theo nhu cầu cụ thể để làm việc với các kho ngữ vựng XML khi đã biết được cấu trúc quy ước. Hơn nữa, NSD cũng có thể xây dựng các từ điển tra cứu dạng ứng dụng Windows hoặc trang web quen thuộc. Văn phạm H2T được xây dựng trong một môi trường ANTLR phát triển tích hợp các công cụ soạn thảo chương trình, biên dịch để tạo sinh mã Java, chạy thử nghiệm và đóng gói sản phẩm, tạo ra các chức năng truy vấn CSDL thông dụng.
PHIẾU ĐĂNG KÝ HỘI NGHỊ QUỐC GIA LẦN THỨ X
MỘT SỐ VẤN ĐỀ CHỌN LỌC
CỦA CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
Chủ đề: Các Hệ thống Thông minh
Đại Lải, 14-15/09/2007
Gửi kèm tóm tắt báo cáo
|
Họ và tên : Phan Huy Khánh
Cơ quan: Khoa Công nghệ Thông tin
Trường Đại học Bách khoa
Đại học Đà Nẵng
Địa chỉ liên lạc : 29 B, Ba Đình, TP. Đà Nẵng
Điện thoại : 0 511 830 168 Mobile : 0905 078 999
E-mail: khanhph@vnn.vn
Có tham gia báo cáo : Có
Tên báo cáo :
PHÁT TRIỂN CÔNG CỤ TƯƠNG TÁC VỚI CÁC KHO NGỮ LIỆU NHỜ VĂN PHẠM TẠO SINH GIAO DIỆN
K
ý tên :
|
Chia sẻ với bạn bè của bạn: |