I. Giới thiệu 2 >II. Web có ngữ nghĩa 2


III.5. Kết luận và huớng phát triển tuơng lai



tải về 0.79 Mb.
trang5/7
Chuyển đổi dữ liệu01.12.2017
Kích0.79 Mb.
#34891
1   2   3   4   5   6   7

III.5. Kết luận và huớng phát triển tuơng lai


:

-Những thách thức về mặt kỹ thuật :về mặt hiện thực lẫn lý thuyết

-Hiệu suất xử lý ngữ nghĩa

-Tập hợp và quản lý nội dung ngữ nghĩa

-Những thách thức liên quan đến các vấn đề pháp lý ,bảo mật ,tính riêng tư khi chia xẻ tài nguyên giữa các hệ thống Grid

IV. Một vài hiện thực của Grid ngữ nghĩa

IV.1. Giới thiệu e-Science


Cụm từ e-Science được sử dụng để mô tả khoa học tính toán tập trung cao (computationally intensive science) được tiến hành trên môi trường mạng phân bố cao, hay khoa học sử dụng tập dữ liệu khổng lồ cần đến môi trường tính toán lưới. Cụm từ được tạo ra bởi John Taylor, Tổng giám đốc của Phòng Khoa học và Công nghệ của Vương quốc Anh vào năm 1999.

Mục tiêu của sáng kiến e-Science là xây dựng một hạ tầng cơ sở cho phép các nhà khoa học tiến hành những nghiên cứu khác nhanh hơn, và tốt hơn. e-Science bao gồm việc xây dựng phần mềm lõi và các ứng dụng về khoa học kỹ thuật triển khai trên phần lõi này. Một số ứng dụng được các trường đại học trong nước đề nghị có thể kể ra như: vật lý phân tử và thiên văn, kỹ thuật và khoa học vật chất, khoa học về sinh học, y tế và môi trường, phân tích mẫu protein, sinh học cấu trúc, sinh học toàn cầu, sự lão hoá sinh học. Ngoài ra, một số ứng dụng mang tầm thách thức lớn lao đòi hỏi sự hợp tác mang tính học thuật như: Advanced Knowledge Technologies, Medical Images and Signals, Equator, DIRC (Dependability).

Phần tiếp theo xin được giới thiệu về dự án myGrid được đề nghị bởi trường đại học Southampton và Manchester, Vương quốc Anh.

IV.2. Tổng quan về myGrid

IV.2.1. Dự án myGrid


Dự án myGrid là một trong những dự án về e-Science của United Kingdom với mục đích xây dựng middleware cho các thí nghiệm in silico thực hiện bởi những nhà khoa học trong phòng thí nghiệm ít tài nguyên (under-resourced labs), người mà sử dụng những ứng dụng của người khác. Phân tích chuỗi (sequence), phân tích siêu ma trận (microarray), protein, hoá tin học (chemoinformatics), xử lý hình ảnh, biểu diễn các bản mẫu Dilbert.

IV.2.2. Bài toán về tính toán lưới


Đó là bài toán về sự chia sẻ tài nguyên giữa các tập hợp không cố định các cá nhân, các cơ quan, và các nguồn tài nguyên một cách hợp tác, linh động, và bảo mật. Tài nguyên ở đây bao gồm: máy tính, cơ sở dữ liệu, tài liệu lưu trữ, con người, thiết bị, kho workflow, các lưu ý cá nhân, các trang web, các cơ quan…

IV.2.3. Mục tiêu


Mục tiêu là xây dựng các công cụ cho người lâp trình phát triển, cho các nhà khoa học sử dụng ứng dụng, và cho các nhà cung cấp tích hợp các ứng dụng mới.

IV.2.4. Một ví dụ


Ví dụ bệnh Graves’ Disease, gây ra do sự tự miễn dịch của tuyến giáp, khi hệ miễn dịch tấn công tuyến giáp và gây ra sự hoạt động quá mức, dẫn tới bướu cổ, tăng mạch đập, sút cân, yếu cơ…Bệnh gây ra do sự kích thích của kháng thể lên cơ quan cảm thụ tuyến giáp, điều này được qui định bí mật bởi tế bào lympho trong hệ miễn dịch. Như vậy, cơ sở khoa học phân tử nào chịu trách nhiệm cho phản ứng tự động miễn dịch này. Đây là một vấn đề sinh học mà myGrid hướng tới giúp giải quyết.

IV.3. Các thuật ngữ trong myGrid

IV.3.1. Workflow


Để quản lý các thí nghiệm, người ta dùng thuật ngữ workflow để mô tả và lưu trữ từng giai đoạn của thí nghiệm, mà mỗi giai đoạn này có thể giống nhau ở những thí nghiệm khác nhau, điều này cho phép người dùng có thể trao đổi một cách linh hoạt các tiến trình và kết quả thí nghiệm.

- Ngôn ngữ định nghĩa workflow là WSFL subset , XScufl.

- Khai phá workflow: là quá trình tìm kiếm những workflow đã được thực hiện.

- Tạo workflow: là quá trình tìm kiếm các lớp dịch vụ có liên quan, hoặc tạo ra chúng nếu không tìm thấy.



Hình sau là một ví dụ về workflow.


IV.3.2. Các thành phần thiết kế thí nghiệm


Bao gồm đặc tả workflow, đặc tả câu query, mục tiêu mô tả ghi chú, ứng dụng, cơ sở dữ liệu, bài báo liên quan, các trang web quan trọng. Các thành phần thiết kế này có thể phân thành 2 loại: thực thể thí nghiệm và thành phần liên kết.

-Các thực thể thí nghiệm: hồ sơ ghi chép của các thí nghiệm, kết quả dữ liệu, lịch sử sử dụng dịch vụ bởi bộ máy workflow, thực thể dịch vụ, tập thong số cho các ứng dụng, lời chú giải về kết quả.

-Các thành phần liên kết: đóng vai trò gom nhóm và liên kết các thành phần thiết kế và thực thể, như một câu query và kết quả, một workflow và kết luận, một workflow và các phiên bản trước và sau nó, một nhóm những thông tin này được liên kết đến tài liệu của các nhà sinh tin học.

IV.3.3. Vòng đời của một thí nghiệm


-Hình thành thí nghiệm

-Cá nhân hoá

-Thực thi thí nghiệm

-Quản lý thí nghiệm

-Cung cấp thí nghiệm

-Khám phá và sử dụng lại



Hình sau mô tả vòng đời của một thí nghiệm.


IV.3.4. Các thành phần ngữ nghĩa


-Cơ sở dữ liệu: dữ liệu mô tả nội dung và ý nghĩa của dịch vụ và tài nguyên.

-Thuật ngữ: chia sẻ vốn từ vựng thông dụng, hỗ trợ các bộ máy tìm kiếm, đại lý, tác giả, người dùng.



-Bản thể học: là các hiểu biết chung và có thể chia sẻ trong một phạm vi, cần thiết trong việc trao đổi, tìm kiếm và khám phá.


tải về 0.79 Mb.

Chia sẻ với bạn bè của bạn:
1   2   3   4   5   6   7




Cơ sở dữ liệu được bảo vệ bởi bản quyền ©hocday.com 2024
được sử dụng cho việc quản lý

    Quê hương