MỘt số VẤN ĐỀ chọn lọc của công nghệ thông tin và truyềN thôNG



tải về 14.67 Kb.
Chuyển đổi dữ liệu30.08.2016
Kích14.67 Kb.
#28932
Hội thảo Quốc gia 2005 Lần thứ X

MỘT SỐ VẤN ĐỀ CHỌN LỌC
CỦA CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG


Chủ đề : Các Hệ thống Thông minh

Đại Lải, 14-15/09/2007
TÓM TẮT BÁO CÁO

PHÁT TRIỂN CÔNG CỤ TƯƠNG TÁC VỚI CÁC KHO NGỮ LIỆU NHỜ VĂN PHẠM TẠO SINH GIAO DIỆN

Phan Huy Khánh, Văn Thị Thu Hương,Thái Thu Hà, Lê Thị Thanh Thủy

Khoa Công nghệ Thông tin

Trường Đại học Bách khoa

Đại học Đà Nẵng

54, Nguyễn Lương Bằng, Hoà Khánh, Liên Chiểu, TP. Đà Nẵng

E-Mail. khanhph@vnn.vn, thaithuha@gmail.com,


vanhuongdn@gmail.com, thanhthuydn@gmail.com

Một trong những thao tác người ta thường hay gặp trong quá trình xử lý ngôn ngữ tự nhiên, đặc biệt là xử lý tiếng Việt, là phải xây dựng các công cụ truy cập đến các cơ sở dữ liệu (CSDL) từ vựng, gọi tắt là kho ngữ vựng. Thông qua giao diện của các công cụ đã được xây dựng này, người sử dụng (NSD) có thể xem nội dung, thống kê, tìm kiếm hay cập nhật dữ liệu... theo nhu cầu. Tuy nhiên, hiện nay, vẫn chưa có nhiều các kho ngữ liệu mẫu tiếng Việt có cấu trúc nhất quán, có nội dung phong phú, đa dụng và dễ dàng khai thác theo định hướng mã nguồn mở. Mặt khác, việc xây dựng các công cụ truy cập dữ liệu như vậy thường mất nhiều rất thời gian và công sức, khó trao đổi giữa các nhóm nghiên cứu với nhau, lại phụ thuộc đáng kể vào bản chất của các kho ngữ vựng. Từ nhu cầu thực tiễn trong việc triển khai các đề tài NCKH tại Trung tâm DATIC, khoa CNTT, Đại học Đà Nẵng, chúng tôi đã đề xuất giải pháp xây dựng một văn phạm được đặt tên là H2T cho phép lập trình tạo sinh các giao diện để từ đó, NSD có thể truy cập đến các kho ngữ vựng dạng XLM có cấu trúc nhất quán đã được định nghĩa trước. Văn phạm H2T áp dụng bộ phân tích cú pháp ANTLR (ANother Tool for Language Recognition) để sản sinh mã Java từ các chương trình giao diện của NSD. Ưu điểm của giải pháp là NSD hoàn toàn có thể xây dựng một không gian giao diện tuỳ theo nhu cầu cụ thể để làm việc với các kho ngữ vựng XML khi đã biết được cấu trúc quy ước. Hơn nữa, NSD cũng có thể xây dựng các từ điển tra cứu dạng ứng dụng Windows hoặc trang web quen thuộc. Văn phạm H2T được xây dựng trong một môi trường ANTLR phát triển tích hợp các công cụ soạn thảo chương trình, biên dịch để tạo sinh mã Java, chạy thử nghiệm và đóng gói sản phẩm, tạo ra các chức năng truy vấn CSDL thông dụng.




PHIẾU ĐĂNG KÝ HỘI NGHỊ QUỐC GIA LẦN THỨ X

MỘT SỐ VẤN ĐỀ CHỌN LỌC
CỦA CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG


Chủ đề: Các Hệ thống Thông minh

Đại Lải, 14-15/09/2007

Gửi kèm tóm tắt báo cáo

Họ và tên : Phan Huy Khánh

Cơ quan: Khoa Công nghệ Thông tin


Trường Đại học Bách khoa
Đại học Đà Nẵng

Địa chỉ liên lạc : 29 B, Ba Đình, TP. Đà Nẵng

Điện thoại : 0 511 830 168 Mobile : 0905 078 999

E-mail: khanhph@vnn.vn

Có tham gia báo cáo :

Tên báo cáo :



PHÁT TRIỂN CÔNG CỤ TƯƠNG TÁC VỚI CÁC KHO NGỮ LIỆU NHỜ VĂN PHẠM TẠO SINH GIAO DIỆN

K


ý tên :









tải về 14.67 Kb.

Chia sẻ với bạn bè của bạn:




Cơ sở dữ liệu được bảo vệ bởi bản quyền ©hocday.com 2024
được sử dụng cho việc quản lý

    Quê hương