Mục lục
I. Giới thiệu 2
II. Web có ngữ nghĩa 2
II.1 Siêu dữ liệu và vấn đề biểu diễn siêu dữ liệu 3
II.2 Ontologies 3
II.2.1 XML 3
II.2.2 XML Namespace 4
II.2.3 XML Schema 5
II.2.4 RDF 6
II.2.5 RDF Schema 7
II.2.6 OWL 8
III. Mô hình S-OGSA 9
III.1 Kiến trúc Grid huớng dịch vụ mở (OGSA) 9
III.3 Nguyên lý thiết kế kiến trúc tham khảo cho hệ thống Grid Ngữ Nghĩa 10
III.3 Mô hình và khả năng của Grid Ngữ Nghĩa 10
III.3.1 Mô hình của Grid Ngữ Nghĩa 10
III.3.2 Các khả năng của Grid ngữ nghĩa 11
III.4.Các cơ chế của Grid Ngữ Nghĩa 13
III.5. Kết luận và huớng phát triển tuơng lai 14
IV. Một vài hiện thực của Grid ngữ nghĩa 14
IV.1. Giới thiệu e-Science 14
IV.2. Tổng quan về myGrid 15
IV.2.1. Dự án myGrid 15
IV.2.2. Bài toán về tính toán lưới 15
IV.2.3. Mục tiêu 15
IV.2.4. Một ví dụ 15
IV.3. Các thuật ngữ trong myGrid 15
IV.3.1. Workflow 15
IV.3.2. Các thành phần thiết kế thí nghiệm 16
IV.3.3. Vòng đời của một thí nghiệm 17
IV.3.4. Các thành phần ngữ nghĩa 17
IV.4. Kiến trúc của myGrid 17
IV.5. Các dịch vụ khái niệm 18
IV.5.1. Dịch vụ bản thể học 18
IV.5.2. Dịch vụ chú giải 19
IV.5.3. Kho dữ liệu của myGrid 19
IV.5.4. Dịch vụ đăng ký 19
IV.5.5. Ghi nhận nguồn gốc và sử dụng lại 20
IV.5.6. Dịch vụ khai phá ngữ nghĩa 20
IV.6. Kết luận 20
Tài liệu tham khảo: 21
I. Giới thiệu
Grid ra đời nhằm hỗ trợ việc chia sẻ tài nguyên một cách an toàn, linh họat và có tổ chức .
Cộng đồng Grid đã phát triển một kiến trúc chung cho các hệ thống Grid, gọi là OGSA (Kiến trúc Grid huớng dịch vụ mở). Kiến trúc này đã giải quyết nhu cầu chuẩn hóa Grid bằng cách định nghĩa một tập cách chức năng và hành vi của một hệ thống Grid.
Một hệ thống Grid muốn họat động phải dựa trên sự am hiểu về các tài nguyên hiện có trong hệ thống, các khả năng, cách phối hợp và khai thác các tài nguyên đó. Hệ thống Grid và các ứng dụng hổ trợ Grid sẽ sử dụng các metadata dùng để mô tả thông tin của tài nguyên Grid một cách thông minh.
Trong các hệ thống Grid hiện thời, các metadata này đuợc quản lý một cách rất phức tạp, không tuờng minh, nằm ẩn sâu trong thư viện mã của Grid. Điều này dẫn đến việc khó chia sẻ tài nguyên giữa các hệ thống Grid với nhau.
Hệ thống Grid ngữ nghĩa ra đời nhằm cung cấp thông tin giàu ngữ nghĩa cho các tài nguyên của Grid, giúp xây dựng các dịch vụ Grid thông minh hơn và giúp việc chia sẻ tài nguyên giữa các hệ thống Grid trở nên dễ dàng .
Gird ngữ nghĩa là sự mở rộng của Grid hiện tại trong đó thông tin và dịch vụ được cung cấp nghĩa được định nghĩa tốt ( well-defined meaning) thông qua các mô tả mà máy tính có thể xử lý được, cho phép chúng được sử dụng bởi con người và máy để con người và máy làm việc cộng tác với nhau
Grid ngữ nghĩa chủ yếu dựa vào công nghệ Web ngữ nghĩa trước đó, đồng thời nó tuân thủ theo mô hình S-OGSA (mở rộng từ OGSA) để thiết kế các thành phần và ứng dụng ngữ nghĩa. Phần II sẽ trình bày công nghệ Web ngữ nghĩa ([Nguyễn Thanh Vũ]), phần III trình bày mô hình S-OGSA([Hoàng Song Cẩm Thạch]) và cuối cùng sẽ là một vài hiện thực của Grid ngữ nghĩa ở phần IV ([Cù Nguyễn Phương Hà])
II. Web có ngữ nghĩa
World Wide Web, gọi tắt là Web hay WWW, được phát minh và đưa vào sử dụng vào khoảng năm 1990,1991 bởi viện sĩ Viện Hàn lâm Anh Tim Berners-Lee. Từ đó đến nay nó đã phát triển một cách rộng khắp và trở thành một dịch vụ không thể thiếu trên Internet. Ban đầu nó đơn thuần chỉ là dịch vụ chia sẽ thông tin nhưng ngày nay nó dần dần tiến tới một kỹ nguyên mới với khái niệm Web 2.0, cho phép người dùng có thể sửa đổi thông tin trực tiếp mà không phải thông qua quyền quản trị, giúp cho con người trên mọi vùng lãnh thổ tiến lại gần nhau hơn.
Tuy nhiên vấn đề của Web hiện tại là thông tin được biểu diễn dưới dạng văn bản thô mà chỉ con người mới có thể đọc hiểu được. Điều này thúc đẩy sự ra đời của ý tưởng Web có ngữ nghĩa (Semantic Web), một thế hệ mới của Web, mà theo Tim Berners-Lee nó là sự mở rộng của Web hiện tại mà trong đó thông tin được định nghĩa rõ ràng sao cho con người và máy tính có thể cùng làm việc với nhau một cách hiệu quả hơn.
Mục tiêu của Web có ngữ nghĩa là phát triển các chuẩn chung và công nghệ cho phép máy tính hiểu được nhiều hơn thông tin trên Web nhằm hổ trợ tốt hơn trong việc khám phá thông tin, tích hợp dữ liệu và tự động hóa các công việc. Phần tiếp theo sẽ trình bày các khái niệm và công nghệ liên quan đến Web có ngữ nghĩa.
II.1 Siêu dữ liệu và vấn đề biểu diễn siêu dữ liệu
Siêu dữ liệu trong ngữ cảnh của Web có ngữ nghĩa là các dữ liệu dùng để mô tả nội dung của trang Web, cho phép máy tính có thể hiểu và xử lý tự động được.Có thể nói siêu dữ liệu là khái niệm đầu tiên và quan trong nhất của Web có ngữ nghĩa.
Một vấn đề được các nhà khoa học quan tâm nhất và cũng là nền tảng nhất của Web có ngữ nghĩa là làm thế nào để nhúng ngữ nghĩa vào các tài liệu web mà hiện nay được viết bằng ngôn ngữ HTML và chỉ có con người mới đọc hiểu được. Hơn nữa việc nhúng ngữ nghĩa này phải được thực hiện một cách tự động để có thể chuyển đổi hàng tỷ các tài liệu web đang có trên World Wide Web thành các trang web có ngữ nghĩa tương ứng. Đó là một thách thức rất lớn mà cho đến nay vẫn chưa thể thực hiện được.
Một thách thức khác liên quan đến vấn đề biểu diễn siêu dữ liệu là làm sao để người sử dụng chấp nhận một chuẩn công nghệ mới (ví dụ như RDF, RDFS,..) khi viết tài liệu web vì từ lâu họ đã quen với việc sử dụng HTML và các công cụ liên quan.
II.2 Ontologies
Trong ngữ cảnh của Web có ngữ nghĩa, Ontology được định nghĩa như là một mô hình dữ liệu biểu diễn một lĩnh vực nào đó, các khái niệm trong lĩnh vực và các mối quan hệ giữa chúng. Hiện nay, các ngôn ngữ ontology quan trọng nhất bao gồm: XML, XML Namespace, XML Schema, RDF, RDF Schema và OWL.
II.2.1 XML
XML (Extensible Markup Language) là ngôn ngữ đánh dấu mở rộng được phát triển dựa trên tính đơn giản, dễ sử dụng của ngôn ngữ HTML nhưng cho phép định nghĩa các thẻ (tab) theo nhu cầu sử dụng để mô tả các tài liệu có cấu trúc mà ngôn ngữ HTML không làm được. XML được thiết kế để cho phép máy tính có thể trao đổi tài liệu với nhau thông qua Web mà không làm mất đi ý nghĩa của dữ liệu.
Một tài liệu XML bao gồm một tập các cặp thẻ (tab) được lồng vào nhau. Mỗi thẻ có một cặp các thuộc tính và giá trị. Ví dụ:
Nguyễn Thanh Vũ
29
Students>
Cấu trúc của một tài liệu XML:
Một tài liệu XML có thể được chia thành hai phần chính, mỗi phần có thể có các thành phần theo quy định khác nhau:
Phần Prolog: chứa các khai báo cho tài liệu XML. Phần này có thể chứa các định đạng như: Các chỉ thị xử lý, định nghĩa kiểu cho tài liệu, chú thích, phiên bản đang sử dụng, cách thức mã hóa dữ liệu, báo cáo các chỉ thị xử lý cho ứng dụng.Ví dụ
Phần thân: chứa nội dung dữ liệu, bao gồm một hay nhiều phần tử, mỗi phần tử được chứa trong một cặp thẻ. Phần tử đầu tiên của tài liệu được gọi là phần tử gốc (root element).
Một tài liệu XML được coi là hợp khuôn dạng (well-form) nếu nó tuân thủ các quy tắc sau:
Các khai báo XML cần được đặt tại dòng đầu tiên của tài liệu, chẳng hạn như khai báo phiên bản hay các chỉ thị xử lý XML.
Mỗi tài liệu XML chỉ có một thành phần gốc (root) chứa mọi thành phần khác trong tài liệu. Các thành phần có thể đứng trước phần tử gốc là chú thích, chỉ thị xử lý và định nghĩa DTD (nếu khai báo ở phần khởi đầu của tài liệu).
Mỗi phần tử của tài liệu phải được nằm trong một cặp thẻ. Nếu là phần tử rỗng thì thẻ phải được kết thúc bằng "/>". Ví dụ: ""
Các thành phần trong tài liệu XML (khác thành phần gốc) đều nằm giữa cặp thẻ gốc và phải lồng nhau một cách hợp lý, tức là không có thành phần phủ, tập hợp thẻ này không được phép chồng lên thẻ kia, mỗi tập trong phải nằm trong tập hợp lớn hơn kế tiếp.
Các cặp thẻ phải được viết chính xác như nhau kể cả chữ hoa hay chữ thường.
Các giá trị của các thuộc tính đều phải nằm giữa hai ngoặc kép. Ví dụ: hide=true là không hợp lệ, mà phải là hide="true".
II.2.2 XML Namespace
XML Namespace là một đặc tính quan trọng của XML. Nó cho phép giải quyết các vấn đề liên quan đến việc xung đột tên các phần tử. Chúng ta xem ví dụ dưới đây
2001-01-01
Mr.
Vũ
Nguyễn
Grid computing
Foster
Phần tử xuất hiện 2 lần trong tài liệu XML ở ví dụ trên ,lần thứ nhất nó ám chỉ danh hiệu (Mr, Mss,..) của một người, lần thứ hai nó ám chỉ tựa đề của một quyển sách. Đó là sự nhập nhằng về tên. W3C giải quyết sự nhập nhằng ấy bằng cách đưa ra khái niệm XML namespace. Một XML namespace, thông thường là một URI, xác định duy nhất một tài nguyên trên Internet. Áp dụng XML namespace vào ví dụ ở trên, ta được:
2001-01-01
Mr.
Vũ
Nguyễn
Grid Computing
Foster
Ta đã tránh được sự nhập nhằng về tên vì bên trong Customer thì dùng namespace http://www.northwindtraders.com/customer và bên trong Book thì dùng namespace http://www.northwindtraders.com/book.
Một cách giải quyết khác là khai báo chữ viết tắt cho các namespaces ngay ở đầu tài liệu. Sau đó bên trong tài liệu ta sẽ prefix các Element cần xác nhận namespace bằng chữ viết tắt của namespace đó. Ví dụ như sau:
xmlns:book="http://www.northwindtraders.com/book" OrderNo="1234">
2001-01-01
Mr.
Vũ
Nguyễn
Grid Computing
Foster
Trong tài liệu XML ở trên ta dùng 3 namespaces:
http://www.northwindtraders.com/order (namespace mặc định),
http://www.northwindtraders.com/customer (viết tắt là cust),
http://www.northwindtraders.com/book (viết tắt là book).
Các phần tử không có prefix (tức là không có chữ tắt đứng trước) như BookOrder, OrderNo, và OrderDate, được coi như thuộc về namespace mặc định.
II.2.3 XML Schema
XML Schema là một ngôn ngữ được dùng để định nghĩa cấu trúc của một tài liệu XML như là phần tử nào xuất hiện trong tài liệu, quan hệ cha con giữa các phần tử, kiểu dữ liệu của các phần tử,..XML Schema sử dụng cú pháp của ngôn ngữ XML và được xem như một sự thay thế cho DTD (Document Type Definition) đã lỗi thời và khó sử dụng.
XML Schema mở đầu bằng khai báo theo chuẩn XML, tiếp theo dùng tiếp đầu ngữ xsd: để khai báo không gian tên XML Schema, theo cú pháp sau:
www.w3.org/1999/XMLSchema>
………….....
II.2.4 RDF
Có thể nói rằng RDF (Resource Description Framework) chính là nền tảng và là linh hồn của Web có ngữ nghĩa. RDF là một ngôn ngữ được dùng để mô tả thông tin về những tài nguyên trên Web và mô tả ngữ nghĩa của những thộng tin ấy theo cách mà máy có thể hiểu được. RDF thích hợp trong những ứng dụng mà ở đó thông tin cần được xử lý bởi máy tính chứ không phải con người. RDF cung cấp một framework chung cho việc biểu diễn thông tin này vì thế nó có thể được trao đổi giữa các ứng dụng mà không làm mất đi ý nghĩa của thông tin. RDF mô tả tài nguyên trên Web thông qua URI (Uniform Resource Identifier).
Trong RDF, thông tin được thể hiện bởi bộ ba subject - predicate – object hay (Subject,Predicate,Object). Ví dụ phát biểu “Joe Smith has homepage http://www.example.org/~joe” sẽ được biểu diễn dưới dạng bộ ba như sau (“Joe Smith”,”has homepage”,”http://www.example.org/~joe”). Các bộ ba này có thể được biểu diễn dưới dạng đồ thị, gọi là đồ thị RDF (RDF Graph). Tất cả các phần tử trong bộ ba là các tài nguyên được xác định duy nhất bởi các URI, riêng thành phần object, nó có thể là URI , là hằng chuỗi hoặc là một con số. Ta biểu diễn phát biểu “Joe Smith has homepage http://www.example.org/~joe” bằng đồ thị RDF như Hình 1.
Hình 1: Mô tả việc biểu diễn thông tin đơn giản bằng bộ ba Subject- Predicate – Object.
Tài nguyên thứ nhất http://www.example.org/~joe/contact.rdf#joesmith mô tả thông tin cho subject, “Joe Smith”. Tài nguyên thứ hai http://xmlns.com/foaf/0.1/homepage mô tả thông tin cho predicate, “has homepage” và tài nguyên thứ ba là http://www.example.org/~joe/ mô tả thông tin cho object, “http://www.example.org/~joe”.
Cú pháp chính qui cho RDF là RDF/XML. Nó là sự kết hợp giữa cú pháp của ngôn ngữ XML và khả năng mô tả tài nguyên thông qua các URI của RDF. Giữa RDF/XML và đồ thị RDF có sự tương đương 1:1. Ví dụ, để biểu diễn đồ thị RDF ở hình 2, ta dùng cú pháp của RDF/XML như sau:
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:foaf="http://xmlns.com/foaf/0.1/"
xmlns="http://www.example.org/~joe/contact.rdf#">
"http://www.example.org/~joe/contact.rdf#joesmith">
rdf:resource="http://www.example.org/~joe/"/>
Smith
Joe
Hình 2: Đồ thị RDF mô tả Joe Smith
II.2.5 RDF Schema
RDF Schema (RDFS) là sự mở rộng của RDF để cho phép mô tả sự phân loại của các lớp (classes) và các thuộc tính (properties). RDF Schema định nghĩa các classes và properties để mô tả các classes, properties và các tài nguyên khác.Nó cũng có thể xem như là một sự mở rộng ngữ nghĩa của RDF để cung cấp những cơ chế cho phép mô tả các nhóm của các tài nguyên liên quan và mối quan hệ giữa các tài nguyên này.
Trong RDFS, classes là một nhóm các tài nguyên có liên quan với nhau. Bảng ở Hình 3 liệt kê danh sách các classes trong RDFS
Element
|
Class of
|
rdfs:subClassOf
|
rdf:type
|
rdfs:Resource
|
all resources
|
rdfs:Resource
|
rdfs:Class
|
rdfs:Class
|
all classes
|
rdfs:Resource
|
rdfs:Class
|
rdfs:Literal
|
literal values
|
rdfs:Resource
|
rdfs:Class
|
rdfs:Datatype
|
datatypes
|
rdfs:Class
|
rdfs:Class
|
rdf:XMLLiteral
|
XML literal values
|
rdfs:Literal
|
rdfs:Datatype
|
rdf:Property
|
properties
|
rdfs:Resource
|
rdfs:Class
|
rdf:Statement
|
statements
|
rdfs:Resource
|
rdfs:Class
|
rdf:List
|
lists
|
rdfs:Resource
|
rdfs:Class
|
rdfs:Container
|
containers
|
rdfs:Resource
|
rdfs:Class
|
rdf:Bag
|
unordered containers
|
rdfs:Container
|
rdfs:Class
|
rdf:Seq
|
ordered containers
|
rdfs:Container
|
rdfs:Class
|
rdf:Alt
|
containers of alternatives
|
rdfs:Container
|
rdfs:Class
|
rdfs:Container
MembershipProperty
|
rdf:_1... Properties
expressing membership
|
rdf:Property
|
rdfs:Class
|
Hình 3: RDFS classes
Properties trong RDFS chính là quan hệ giữa các Subjects và Objects trong RDF. Danh sách các properties được liệt trong trong bảng ở Hình 4.
Element
|
Relates
|
rdfs:domain
|
rdfs:range
|
rdfs:range
|
restricts subjects
|
rdf:Property
|
rdfs:Class
|
rdfs:domain
|
restricts objects
|
rdf:Property
|
rdfs:Class
|
rdf:type
|
instance of
|
rdfs:Resource
|
rdfs:Class
|
rdfs:subClassOf
|
subclass of
|
rdfs:Class
|
rdfs:Class
|
rdfs:subPropertyOf
|
subproperty of
|
rdf:Property
|
rdf:Property
|
rdfs:label
|
human readable label
|
rdfs:Resource
|
rdfs:Literal
|
rdfs:comment
|
human readable comment
|
rdfs:Resource
|
rdfs:Literal
|
rdfs:member
|
container membership
|
rdfs:Resource
|
rdfs:Resource
|
rdf:first
|
First element
|
rdf:List
|
rdfs:Resource
|
rdf:rest
|
rest of list
|
rdf:List
|
rdf:List
|
rdf:_1, rdf:_2, ...
|
container membership
|
rdfs:Container
|
rdfs:Resource
|
rdfs:seeAlso
|
further information
|
rdfs:Resource
|
rdfs:Resource
|
rdfs:isDefinedBy
|
definition
|
rdfs:Resource
|
rdfs:Resource
|
rdf:value
|
For structured values
|
rdfs:Resource
|
rdfs:Resource
|
rdf:object
|
object of statement
|
rdf:Statement
|
rdfs:Resource
|
rdf:predicate
|
predicate of statement
|
rdf:Statement
|
rdfs:Resource
|
rdf:subject
|
subject of of statement
|
rdf:Statement
|
rdfs:Resource
|
Hình 4: RDFS Properties
II.2.6 OWL
OWL ( Web Ontology Language) là một sự mở rộng từ RDF và RDFS. Mục đích chính của OWL là đưa khả năng suy luận vào Web có ngữ nghĩa. OLW có ba loại: OWL Lite, OWL DL và OWL Full. Mỗi loại OWL sẽ có những đặc tính riêng và do đó sẽ phù hợp trong ngữ cảnh của một ứng dụng nào đó.
Chia sẻ với bạn bè của bạn: |