I. Giới thiệu 2 >II. Web có ngữ nghĩa 2



tải về 0.79 Mb.
trang1/7
Chuyển đổi dữ liệu01.12.2017
Kích0.79 Mb.
  1   2   3   4   5   6   7


Mục lục


I. Giới thiệu 2

II. Web có ngữ nghĩa 2

II.1 Siêu dữ liệu và vấn đề biểu diễn siêu dữ liệu 3

II.2 Ontologies 3

II.2.1 XML 3

II.2.2 XML Namespace 4

II.2.3 XML Schema 5

II.2.4 RDF 6

II.2.5 RDF Schema 7

II.2.6 OWL 8

III. Mô hình S-OGSA 9

III.1 Kiến trúc Grid huớng dịch vụ mở (OGSA) 9

III.3 Nguyên lý thiết kế kiến trúc tham khảo cho hệ thống Grid Ngữ Nghĩa 10

III.3 Mô hình và khả năng của Grid Ngữ Nghĩa 10

III.3.1 Mô hình của Grid Ngữ Nghĩa 10

III.3.2 Các khả năng của Grid ngữ nghĩa 11

III.4.Các cơ chế của Grid Ngữ Nghĩa 13

III.5. Kết luận và huớng phát triển tuơng lai 14

IV. Một vài hiện thực của Grid ngữ nghĩa 14

IV.1. Giới thiệu e-Science 14

IV.2. Tổng quan về myGrid 15

IV.2.1. Dự án myGrid 15

IV.2.2. Bài toán về tính toán lưới 15

IV.2.3. Mục tiêu 15

IV.2.4. Một ví dụ 15

IV.3. Các thuật ngữ trong myGrid 15

IV.3.1. Workflow 15

IV.3.2. Các thành phần thiết kế thí nghiệm 16

IV.3.3. Vòng đời của một thí nghiệm 17

IV.3.4. Các thành phần ngữ nghĩa 17

IV.4. Kiến trúc của myGrid 17

IV.5. Các dịch vụ khái niệm 18

IV.5.1. Dịch vụ bản thể học 18

IV.5.2. Dịch vụ chú giải 19

IV.5.3. Kho dữ liệu của myGrid 19

IV.5.4. Dịch vụ đăng ký 19

IV.5.5. Ghi nhận nguồn gốc và sử dụng lại 20

IV.5.6. Dịch vụ khai phá ngữ nghĩa 20

IV.6. Kết luận 20

Tài liệu tham khảo: 21




I. Giới thiệu


Grid ra đời nhằm hỗ trợ việc chia sẻ tài nguyên một cách an toàn, linh họat và có tổ chức .

Cộng đồng Grid đã phát triển một kiến trúc chung cho các hệ thống Grid, gọi là OGSA (Kiến trúc Grid huớng dịch vụ mở). Kiến trúc này đã giải quyết nhu cầu chuẩn hóa Grid bằng cách định nghĩa một tập cách chức năng và hành vi của một hệ thống Grid.

Một hệ thống Grid muốn họat động phải dựa trên sự am hiểu về các tài nguyên hiện có trong hệ thống, các khả năng, cách phối hợp và khai thác các tài nguyên đó. Hệ thống Grid và các ứng dụng hổ trợ Grid sẽ sử dụng các metadata dùng để mô tả thông tin của tài nguyên Grid một cách thông minh.

Trong các hệ thống Grid hiện thời, các metadata này đuợc quản lý một cách rất phức tạp, không tuờng minh, nằm ẩn sâu trong thư viện mã của Grid. Điều này dẫn đến việc khó chia sẻ tài nguyên giữa các hệ thống Grid với nhau.

Hệ thống Grid ngữ nghĩa ra đời nhằm cung cấp thông tin giàu ngữ nghĩa cho các tài nguyên của Grid, giúp xây dựng các dịch vụ Grid thông minh hơn và giúp việc chia sẻ tài nguyên giữa các hệ thống Grid trở nên dễ dàng .
Gird ngữ nghĩa là sự mở rộng của Grid hiện tại trong đó thông tin và dịch vụ được cung cấp nghĩa được định nghĩa tốt ( well-defined meaning) thông qua các mô tả mà máy tính có thể xử lý được, cho phép chúng được sử dụng bởi con người và máy để con người và máy làm việc cộng tác với nhau
Grid ngữ nghĩa chủ yếu dựa vào công nghệ Web ngữ nghĩa trước đó, đồng thời nó tuân thủ theo mô hình S-OGSA (mở rộng từ OGSA) để thiết kế các thành phần và ứng dụng ngữ nghĩa. Phần II sẽ trình bày công nghệ Web ngữ nghĩa ([Nguyễn Thanh Vũ]), phần III trình bày mô hình S-OGSA([Hoàng Song Cẩm Thạch]) và cuối cùng sẽ là một vài hiện thực của Grid ngữ nghĩa ở phần IV ([Cù Nguyễn Phương Hà])

II. Web có ngữ nghĩa


World Wide Web, gọi tắt là Web hay WWW, được phát minh và đưa vào sử dụng vào khoảng năm 1990,1991 bởi viện sĩ Viện Hàn lâm Anh Tim Berners-Lee. Từ đó đến nay nó đã phát triển một cách rộng khắp và trở thành một dịch vụ không thể thiếu trên Internet. Ban đầu nó đơn thuần chỉ là dịch vụ chia sẽ thông tin nhưng ngày nay nó dần dần tiến tới một kỹ nguyên mới với khái niệm Web 2.0, cho phép người dùng có thể sửa đổi thông tin trực tiếp mà không phải thông qua quyền quản trị, giúp cho con người trên mọi vùng lãnh thổ tiến lại gần nhau hơn.

Tuy nhiên vấn đề của Web hiện tại là thông tin được biểu diễn dưới dạng văn bản thô mà chỉ con người mới có thể đọc hiểu được. Điều này thúc đẩy sự ra đời của ý tưởng Web có ngữ nghĩa (Semantic Web), một thế hệ mới của Web, mà theo Tim Berners-Lee nó là sự mở rộng của Web hiện tại mà trong đó thông tin được định nghĩa rõ ràng sao cho con người và máy tính có thể cùng làm việc với nhau một cách hiệu quả hơn.

Mục tiêu của Web có ngữ nghĩa là phát triển các chuẩn chung và công nghệ cho phép máy tính hiểu được nhiều hơn thông tin trên Web nhằm hổ trợ tốt hơn trong việc khám phá thông tin, tích hợp dữ liệu và tự động hóa các công việc. Phần tiếp theo sẽ trình bày các khái niệm và công nghệ liên quan đến Web có ngữ nghĩa.

II.1 Siêu dữ liệu và vấn đề biểu diễn siêu dữ liệu


Siêu dữ liệu trong ngữ cảnh của Web có ngữ nghĩa là các dữ liệu dùng để mô tả nội dung của trang Web, cho phép máy tính có thể hiểu và xử lý tự động được.Có thể nói siêu dữ liệu là khái niệm đầu tiên và quan trong nhất của Web có ngữ nghĩa.

Một vấn đề được các nhà khoa học quan tâm nhất và cũng là nền tảng nhất của Web có ngữ nghĩa là làm thế nào để nhúng ngữ nghĩa vào các tài liệu web mà hiện nay được viết bằng ngôn ngữ HTML và chỉ có con người mới đọc hiểu được. Hơn nữa việc nhúng ngữ nghĩa này phải được thực hiện một cách tự động để có thể chuyển đổi hàng tỷ các tài liệu web đang có trên World Wide Web thành các trang web có ngữ nghĩa tương ứng. Đó là một thách thức rất lớn mà cho đến nay vẫn chưa thể thực hiện được.

Một thách thức khác liên quan đến vấn đề biểu diễn siêu dữ liệu là làm sao để người sử dụng chấp nhận một chuẩn công nghệ mới (ví dụ như RDF, RDFS,..) khi viết tài liệu web vì từ lâu họ đã quen với việc sử dụng HTML và các công cụ liên quan.

II.2 Ontologies


Trong ngữ cảnh của Web có ngữ nghĩa, Ontology được định nghĩa như là một mô hình dữ liệu biểu diễn một lĩnh vực nào đó, các khái niệm trong lĩnh vực và các mối quan hệ giữa chúng. Hiện nay, các ngôn ngữ ontology quan trọng nhất bao gồm: XML, XML Namespace, XML Schema, RDF, RDF Schema và OWL.

II.2.1 XML


XML (Extensible Markup Language) là ngôn ngữ đánh dấu mở rộng được phát triển dựa trên tính đơn giản, dễ sử dụng của ngôn ngữ HTML nhưng cho phép định nghĩa các thẻ (tab) theo nhu cầu sử dụng để mô tả các tài liệu có cấu trúc mà ngôn ngữ HTML không làm được. XML được thiết kế để cho phép máy tính có thể trao đổi tài liệu với nhau thông qua Web mà không làm mất đi ý nghĩa của dữ liệu.

Một tài liệu XML bao gồm một tập các cặp thẻ (tab) được lồng vào nhau. Mỗi thẻ có một cặp các thuộc tính và giá trị. Ví dụ:




Nguyễn Thanh Vũ
      29



Cấu trúc của một tài liệu XML:

  • Một tài liệu XML có thể được chia thành hai phần chính, mỗi phần có thể có các thành phần theo quy định khác nhau:

    • Phần Prolog: chứa các khai báo cho tài liệu XML. Phần này có thể chứa các định đạng như: Các chỉ thị xử lý, định nghĩa kiểu cho tài liệu, chú thích, phiên bản đang sử dụng, cách thức mã hóa dữ liệu, báo cáo các chỉ thị xử lý cho ứng dụng.Ví dụ



    • Phần thân: chứa nội dung dữ liệu, bao gồm một hay nhiều phần tử, mỗi phần tử được chứa trong một cặp thẻ. Phần tử đầu tiên của tài liệu được gọi là phần tử gốc (root element).

  • Một tài liệu XML được coi là hợp khuôn dạng (well-form) nếu nó tuân thủ các quy tắc sau:

    • Các khai báo XML cần được đặt tại dòng đầu tiên của tài liệu, chẳng hạn như khai báo phiên bản hay các chỉ thị xử lý XML.

    • Mỗi tài liệu XML chỉ có một thành phần gốc (root) chứa mọi thành phần khác trong tài liệu. Các thành phần có thể đứng trước phần tử gốc là chú thích, chỉ thị xử lý và định nghĩa DTD (nếu khai báo ở phần khởi đầu của tài liệu).

    • Mỗi phần tử của tài liệu phải được nằm trong một cặp thẻ. Nếu là phần tử rỗng thì thẻ phải được kết thúc bằng "/>". Ví dụ: ""

    • Các thành phần trong tài liệu XML (khác thành phần gốc) đều nằm giữa cặp thẻ gốc và phải lồng nhau một cách hợp lý, tức là không có thành phần phủ, tập hợp thẻ này không được phép chồng lên thẻ kia, mỗi tập trong phải nằm trong tập hợp lớn hơn kế tiếp.

    • Các cặp thẻ phải được viết chính xác như nhau kể cả chữ hoa hay chữ thường.

    • Các giá trị của các thuộc tính đều phải nằm giữa hai ngoặc kép. Ví dụ: hide=true là không hợp lệ, mà phải là hide="true".



II.2.2 XML Namespace


XML Namespace là một đặc tính quan trọng của XML. Nó cho phép giải quyết các vấn đề liên quan đến việc xung đột tên các phần tử. Chúng ta xem ví dụ dưới đây



   2001-01-01

  

      Mr.

     

      Nguyễn

  

  

      Grid computing

      Foster

  


Phần tử xuất hiện 2 lần trong tài liệu XML ở ví dụ trên ,lần thứ nhất nó ám chỉ danh hiệu (Mr, Mss,..) của một người, lần thứ hai nó ám chỉ tựa đề của một quyển sách. Đó là sự nhập nhằng về tên. W3C giải quyết sự nhập nhằng ấy bằng cách đưa ra khái niệm XML namespace. Một XML namespace, thông thường là một URI, xác định duy nhất một tài nguyên trên Internet. Áp dụng XML namespace vào ví dụ ở trên, ta được: <br /><i><?xml version="1.0"?></i> <br /> <br /><i><BookOrder OrderNo="1234"></i> </p> <p>   <i><OrderDate>2001-01-01</OrderDate></i></p> <p>   <i><b><Customer xmlns="http://www.northwindtraders.com/customer"></b></i> </p> <p>      <i><Title>Mr.

     

      Nguyễn

  

  

      Grid Computing

      Foster

  


Ta đã tránh được sự nhập nhằng về tên vì bên trong Customer thì dùng namespace http://www.northwindtraders.com/customer và bên trong Book thì dùng namespace http://www.northwindtraders.com/book.

Một cách giải quyết khác là khai báo chữ viết tắt cho các namespaces ngay ở đầu tài liệu. Sau đó bên trong tài liệu ta sẽ prefix các Element cần xác nhận namespace bằng chữ viết tắt của namespace đó. Ví dụ như sau:




       xmlns:book="http://www.northwindtraders.com/book" OrderNo="1234">

   2001-01-01

 

      Mr.

     

      Nguyễn

 

 

      Grid Computing

      Foster

  




Trong tài liệu XML ở trên ta dùng 3 namespaces:

http://www.northwindtraders.com/order (namespace mặc định),

http://www.northwindtraders.com/customer (viết tắt là cust),

http://www.northwindtraders.com/book (viết tắt là book).

 

Các phần tử không có prefix (tức là không có chữ tắt đứng trước) như BookOrder, OrderNo, và OrderDate, được coi như thuộc về namespace mặc định.


II.2.3 XML Schema


XML Schema là một ngôn ngữ được dùng để định nghĩa cấu trúc của một tài liệu XML như là phần tử nào xuất hiện trong tài liệu, quan hệ cha con giữa các phần tử, kiểu dữ liệu của các phần tử,..XML Schema sử dụng cú pháp của ngôn ngữ XML và được xem như một sự thay thế cho DTD (Document Type Definition) đã lỗi thời và khó sử dụng.

XML Schema mở đầu bằng khai báo theo chuẩn XML, tiếp theo dùng tiếp đầu ngữ xsd: để khai báo không gian tên XML Schema, theo cú pháp sau:



www.w3.org/1999/XMLSchema>
     ………….....

II.2.4 RDF


Có thể nói rằng RDF (Resource Description Framework) chính là nền tảng và là linh hồn của Web có ngữ nghĩa. RDF là một ngôn ngữ được dùng để mô tả thông tin về những tài nguyên trên Web và mô tả ngữ nghĩa của những thộng tin ấy theo cách mà máy có thể hiểu được. RDF thích hợp trong những ứng dụng mà ở đó thông tin cần được xử lý bởi máy tính chứ không phải con người. RDF cung cấp một framework chung cho việc biểu diễn thông tin này vì thế nó có thể được trao đổi giữa các ứng dụng mà không làm mất đi ý nghĩa của thông tin. RDF mô tả tài nguyên trên Web thông qua URI (Uniform Resource Identifier).

Trong RDF, thông tin được thể hiện bởi bộ ba subject - predicate – object hay (Subject,Predicate,Object). Ví dụ phát biểu “Joe Smith has homepage http://www.example.org/~joe” sẽ được biểu diễn dưới dạng bộ ba như sau (“Joe Smith”,”has homepage”,”http://www.example.org/~joe”). Các bộ ba này có thể được biểu diễn dưới dạng đồ thị, gọi là đồ thị RDF (RDF Graph). Tất cả các phần tử trong bộ ba là các tài nguyên được xác định duy nhất bởi các URI, riêng thành phần object, nó có thể là URI , là hằng chuỗi hoặc là một con số. Ta biểu diễn phát biểu “Joe Smith has homepage http://www.example.org/~joe” bằng đồ thị RDF như Hình 1.



Hình 1: Mô tả việc biểu diễn thông tin đơn giản bằng bộ ba Subject- Predicate – Object.
Tài nguyên thứ nhất http://www.example.org/~joe/contact.rdf#joesmith mô tả thông tin cho subject, “Joe Smith”. Tài nguyên thứ hai http://xmlns.com/foaf/0.1/homepage mô tả thông tin cho predicate, “has homepage” và tài nguyên thứ ba là http://www.example.org/~joe/ mô tả thông tin cho object, “http://www.example.org/~joe”.

Cú pháp chính qui cho RDF là RDF/XML. Nó là sự kết hợp giữa cú pháp của ngôn ngữ XML và khả năng mô tả tài nguyên thông qua các URI của RDF. Giữa RDF/XML và đồ thị RDF có sự tương đương 1:1. Ví dụ, để biểu diễn đồ thị RDF ở hình 2, ta dùng cú pháp của RDF/XML như sau:




xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"

xmlns:foaf="http://xmlns.com/foaf/0.1/"

xmlns="http://www.example.org/~joe/contact.rdf#">



"http://www.example.org/~joe/contact.rdf#joesmith">





rdf:resource="http://www.example.org/~joe/"/>

Smith

Joe





Hình 2: Đồ thị RDF mô tả Joe Smith

II.2.5 RDF Schema


RDF Schema (RDFS) là sự mở rộng của RDF để cho phép mô tả sự phân loại của các lớp (classes) và các thuộc tính (properties). RDF Schema định nghĩa các classes và properties để mô tả các classes, properties và các tài nguyên khác.Nó cũng có thể xem như là một sự mở rộng ngữ nghĩa của RDF để cung cấp những cơ chế cho phép mô tả các nhóm của các tài nguyên liên quan và mối quan hệ giữa các tài nguyên này.

Trong RDFS, classes là một nhóm các tài nguyên có liên quan với nhau. Bảng ở Hình 3 liệt kê danh sách các classes trong RDFS




Element

Class of

rdfs:subClassOf

rdf:type

rdfs:Resource

all resources

rdfs:Resource

rdfs:Class

rdfs:Class

all classes

rdfs:Resource

rdfs:Class

rdfs:Literal

literal values

rdfs:Resource

rdfs:Class

rdfs:Datatype

datatypes

rdfs:Class

rdfs:Class

rdf:XMLLiteral

XML literal values

rdfs:Literal

rdfs:Datatype

rdf:Property

properties

rdfs:Resource

rdfs:Class

rdf:Statement

statements

rdfs:Resource

rdfs:Class

rdf:List

lists

rdfs:Resource

rdfs:Class

rdfs:Container

containers

rdfs:Resource

rdfs:Class

rdf:Bag

unordered containers

rdfs:Container

rdfs:Class

rdf:Seq

ordered containers

rdfs:Container

rdfs:Class

rdf:Alt

containers of alternatives

rdfs:Container

rdfs:Class

rdfs:Container
MembershipProperty

rdf:_1... Properties
expressing membership

rdf:Property

rdfs:Class


Hình 3: RDFS classes
Properties trong RDFS chính là quan hệ giữa các Subjects và Objects trong RDF. Danh sách các properties được liệt trong trong bảng ở Hình 4.


Element

Relates

rdfs:domain

rdfs:range

rdfs:range

restricts subjects

rdf:Property

rdfs:Class

rdfs:domain

restricts objects

rdf:Property

rdfs:Class

rdf:type

instance of

rdfs:Resource

rdfs:Class

rdfs:subClassOf

subclass of

rdfs:Class

rdfs:Class

rdfs:subPropertyOf

subproperty of

rdf:Property

rdf:Property

rdfs:label

human readable label

rdfs:Resource

rdfs:Literal

rdfs:comment

human readable comment

rdfs:Resource

rdfs:Literal

rdfs:member

container membership

rdfs:Resource

rdfs:Resource

rdf:first

First element

rdf:List

rdfs:Resource

rdf:rest

rest of list

rdf:List

rdf:List

rdf:_1, rdf:_2, ...

container membership

rdfs:Container

rdfs:Resource

rdfs:seeAlso

further information

rdfs:Resource

rdfs:Resource

rdfs:isDefinedBy

definition

rdfs:Resource

rdfs:Resource

rdf:value

For structured values

rdfs:Resource

rdfs:Resource

rdf:object

object of statement

rdf:Statement

rdfs:Resource

rdf:predicate

predicate of statement

rdf:Statement

rdfs:Resource

rdf:subject

subject of of statement

rdf:Statement

rdfs:Resource


Hình 4: RDFS Properties

II.2.6 OWL


OWL ( Web Ontology Language) là một sự mở rộng từ RDF và RDFS. Mục đích chính của OWL là đưa khả năng suy luận vào Web có ngữ nghĩa. OLW có ba loại: OWL Lite, OWL DL và OWL Full. Mỗi loại OWL sẽ có những đặc tính riêng và do đó sẽ phù hợp trong ngữ cảnh của một ứng dụng nào đó.



  1   2   3   4   5   6   7


Cơ sở dữ liệu được bảo vệ bởi bản quyền ©hocday.com 2019
được sử dụng cho việc quản lý

    Quê hương