XỬ LÝ CÁc câu truy vấn và TÌm kiếm trên kho tài liệu có chú thích ngữ nghĩa bằng tiếng anh


Lưu trữ đồ thị và hiển thị đồ thị [tham khảo HA]



tải về 0.6 Mb.
trang12/14
Chuyển đổi dữ liệu02.09.2016
Kích0.6 Mb.
#30769
1   ...   6   7   8   9   10   11   12   13   14

5.3Lưu trữ đồ thị và hiển thị đồ thị [tham khảo HA]


Trước khi hiển thị kết quả ra màn hình, chương trình dùng cấu trúc dữ liệu như sau để lưu trữ đồ thị ý niệm trong bộ nhớ:

[hình tham khảo HA]

Cấu trúc dữ liệu trên sẽ gồm một mảng các phần tử. Mỗi phần tử có vùng lưu trữ Sub-CG chứa đựng thông tin để xây dựng đồ thị ý niệm nguyên tử (atomic conceptual graph), là đồ thị ý niệm mà không chứa liên từ luận lý trong câu truy vấn. “Các thông tin để xây dựng đồ thị ý niệm nguyên tử bao gồm thông tin về thực thể, kiểu quan hệ giữa các thực thể và chiều của quan hệ. Dữ liệu được lưu trong vùng lưu trữ Sub-CG sau đó sẽ được dùng để biểu diễn thành một đỉnh truy vấn con.”

Mỗi phần tử có thuộc tính Next relation lưu trữ kiểu quan hệ giữa hai đỉnh truy vấn con liền nhau. Các giá trị có thể có của Next relation chính là kiểu quan hệ có thể có giữa hai đỉnh truy vấn con trong câu truy vấn có liên từ luận lý, cụ thể là UNION, INTERSECT, MINUS.

“Thêm vào đó, cấu trúc dữ liệu có một thuộc tính Top relation để lưu trữ quan hệ gộp của câu truy vấn. Đó có thể là quan hệ COUNT đối với câu truy vấn có từ để hỏi là “How many”, hoặc quan hệ MIN, MAX đối với các truy vấn có tính từ so sánh nhất.”

Từ cấu trúc dữ liệu nêu trên. Đồ thị ý niệm được hiển thị ra màn hình có dạng tổng quát như hình sau:



[hình tham khảo HA]

“Trong đó, mỗi đỉnh truy vấn con được xây dựng từ vùng lưu trữ Sub-CG của mỗi thành phần trong cấu trúc lưu trữ. Quan hệ giữa các đỉnh truy vấn con (UNION, INTERSECT, MINUS) được xây dựng từ thuộc tính Next relation. Quan hệ gộp (COUNT, MAX, MIN) được xây dựng từ thuộc tính Top relation của cấu trúc lưu trữ. Đường liên kết nét đôi sẽ được nối từ quan hệ gộp vừa tạo tới thực thể câu truy vấn về số lượng trong trường hợp truy vấn “How many” hoặc nối tới biểu diễn tính từ nằm trong đỉnh truy vấn con tương ứng trong trường hợp câu truy vấn có chứa tính từ so sánh nhất.”

Lấy một ví dụ cho phương pháp lưu trữ và hiển thị như phân tích nêu trên: câu truy vấn “Who was biographer and Samuel Johnsons's friend?”, hệ thống sẽ kết xuất ra đồ thị ý niệm như ví dụ sau:



[hình tham khảo HA]


5.4Xây dựng câu truy vấn SeRQL


Dù đồ thị ý niệm là một ngôn ngữ vừa dễ hiểu với con người, vừa khả xử lý với máy tính, nhưng đồ thị ý niệm mới chỉ mang tính chất tham khảo, để kiểm tra sự chính xác của quá trình xử lý câu truy vấn. Bởi vì, đồ thị ý niệm chưa được sử dụng làm ngôn ngữ truy vấn trên bất cứ cơ sở dữ liệu ngữ nghĩa nào, nên máy tính không thể trực tiếp dùng đồ thị để tìm thực thể hay tài liệu. Vì vậy, trong chương này sẽ trình bày phương pháp dịch đồ thị sang ngôn ngữ SeRQL, là ngôn ngữ truy vấn sử dụng bởi cơ sở tri thức ngữ nghĩa.

Một phần trong quá trình sinh câu SeRQL của hệ thống sẽ sử dụng lại giải thuật trước đây của VN-KIM Search [tham khảo Dũng], chỉ thêm vào những đoạn cần thiết để những câu truy vấn có tính từ.

Giải thuật đã có của VN-KIM Search như sau:

Generalize the query CG

For each relation in the generalized query CG do

{

Get all neighbour concepts of the current relation



//process each concept sequentially

For each concept do

{

if the concept is new //i.e. not processed before



{

if the concept referent is “?” or “*”

{

if the concept referent is “?”



{

Assign to it a variable starting with “x” //e.g x1, x2, x3,...

Assign to it a label variable starting with “z” //e.g z1, z2, z3,...

Append these variables to the SELECT clause

Append the “rdfs:label” statement for this concept to the FROM clause

}

if the concept referent is “*”



{

Assign to it a variable starting with “y” //e.g y1, y2, y3,...

}

Append the “rdf:type” statement for this concept to the FROM clause



Append the constrained property statements for this concept to the FROM clause

Assign to the constrained properties variables starting with “p” //e.g p1, p2, p3,...

Append the property constraints to the WHERE clause

} //end of “?” or “*”

if the concept referent is specific, assign to it its identifier as a dummy variable

Remember this concept having been processed

}

}//end of if new



Assign to the current relation its URI

Append the statement for the current relation with its neighbour concepts to the FROM clause

}

//process the disconnected concept nodes



For each concepts that has not been visited yet, process it as above

[hình tham khảo Dũng]

Giải thuật đề tài này thêm vào để xử lý tính từ sẽ nhận kết quả của giải thuật trên làm đầu vào, rồi thêm những bộ phận cần thiết:

Giải thuật cho tính từ bình thường (dạng nguyên mẫu): Truy vấn tất cả thực thể phù hợp và trả về theo một trật tự

//Function: append ORDER BY clause for normal adjective to the input SeRQL

Initialize new ORDER BY clause

For each semantic relation generated from normal adjective

{

Append the its object’ variable to SELECT clause



Identify the way of ordering //i.e DESC or ASC. Use a dictionary (XML file)

Append to ORDER BY clause the variable of the relation’s object, and the way it is ordered

}


Giải thuật cho tính từ so sánh nhất:

//Function: append WHERE clause for superlative adjective to the input SeRQL

Initialize the WHERE, nested SELECT and nested FROM clause

//select the value of all other entities which are also qualified, then use “>= ALL” or “<= ALL” to //find the entity that has the maximum and minimum value

Identify whether “>= ALL” or “<=ALL” from the Top relation. Call this OP.

Find the relation that is generated from superlative adjective

{

With its subject, create a new variable representing all others qualified entities. Call this the temporary subject. Then use the temporary subject to append all constraints on the subject to the nested FROM clause



With its object, create a new variable representing all others qualified entities’ values. Call this the temporary object. Append the temporary object to the nested SELECT clause.

Append the statement of this relation to the nested FROM clause. But use the temporary subject and temporary object as the 2 variables.

Append to WHERE clause the object’s variable and the OP identified before.

}


Giải thuật cho tính từ so sánh hơn:

//Function: append WHERE clause for comparative adjective to the input SeRQL

Initialize the WHERE clause

For every relation generated from comparative adjective

{

Append its subject’s variable to the WHERE clause



Identify the comparative operator //i.e. “>” or “<”. Use a dictionary (XML file)

Append comparative operator to the WHERE clause

if its object is a named entity, append its object’s variable to the WHERE clause

else if its object is a constant, append its object’s quantifier to the WHERE clause

}




Каталог: nonghocbucket -> UploadDocument server07 id114188 190495
UploadDocument server07 id114188 190495 -> ChuyêN ĐỀ ĐIỀu khiển tán sắC
UploadDocument server07 id114188 190495 -> Trong khuôn khổ Hội nghị của fifa năm 1928 được tổ chức tại Amsterdam (Hà Lan), Henry Delaunay đã đưa ra một đề xuất mang tính đột phá đối với lịch sử bóng đá
UploadDocument server07 id114188 190495 -> MỤc lục phần I: MỞ ĐẦU
UploadDocument server07 id114188 190495 -> «Quản trị Tài sản cố định trong Công ty cổ phần Điện lực Khánh Hòa»
UploadDocument server07 id114188 190495 -> Khóa luận tốt nghiệp 2010 Mục tiêu phát triển kinh tế xã hội trong thời kì tới 85
UploadDocument server07 id114188 190495 -> ĐỒ Án tốt nghiệp tk nhà MÁY ĐƯỜng hiệN ĐẠi rs
UploadDocument server07 id114188 190495 -> Đề tài: Qúa trình hình thành và phát triển an sinh xã hội ở Việt Nam
UploadDocument server07 id114188 190495 -> Chuyên đề tốt nghiệp Trần Thị Ngọc – lt2 khct L ời cảM ƠN
UploadDocument server07 id114188 190495 -> Địa vị của nhà vua trong nhà nước phong kiến Việt Nam

tải về 0.6 Mb.

Chia sẻ với bạn bè của bạn:
1   ...   6   7   8   9   10   11   12   13   14




Cơ sở dữ liệu được bảo vệ bởi bản quyền ©hocday.com 2024
được sử dụng cho việc quản lý

    Quê hương